연세대발 AI 부정행위 파문… 잇따르는 대학가 온라인 시험 논란
연세대 온라인 시험에서 드러난 ‘집단 커닝’ 정황 최근 연세대학교의 한 대형 교양과목 온라인 퀴즈 시험에서 학생들이 집단으로 부정행위를 한 정황이 포착되며 논란이 일었다. 해당 과목(‘고전문학과 상상력’)의 수강생 약 200명 중 일부가 시험 도중 문제와 정답을 대학 커뮤니티 앱의 익명 채팅방을 통해 주고받고, 구글 독스 등을 활용해 실시간으로 답안을 공유한 것으로 드러난 것이다. 이 강좌에서는 이미 지난 10월 비대면 중간고사에서도 부정행위 의혹이 불거졌고, 결국 담당 교수는 기말고사를 대면시험으로 전환했으나 마지막 퀴즈만은 온라인으로 시행되었다. 그 결과 시험 관리의 빈틈을 파고든 학생들의 집단 커닝이 또다시 발생한 셈이다.
연세대에서 촉발된 이번 ‘AI 커닝’ 파문은 해당 학교 안팎에 큰 충격을 주었다. 앞서 연세대 교양과목 ‘자연어 처리와 챗GPT’의 비대면 중간고사에서도 약 600명의 수강생 중 190여 명이 챗GPT 등 생성형 AI를 활용해 답안을 작성한 부정행위에 연루된 것으로 확인된 바 있다. 당시 담당 교수는 학생들로 하여금 시험 시간 동안 자신의 화면과 손·얼굴이 나오도록 영상을 녹화해 제출하게 하는 등 부정행위 방지 장치를 도입했음에도 다수의 학생이 AI를 이용한 커닝을 시도한 것으로 밝혀졌다. 교수는 “자진 신고한 학생에 한해 중간고사 성적만 0점 처리하고, 끝까지 발뺌하는 학생은 학칙에 따라 유기정학 처분을 추진하겠다”라는 강경 방침을 밝히며 논란을 공론화했다. 연세대는 이러한 사태가 불거지자 AI 윤리 확립과 평가 방식 개선을 위한 긴급 공청회를 열고, 단순히 부정행위자 징계에 그치지 않고 학습·평가 체계 전반을 재정비하겠다는 계획을 발표했다.
고려대·서울대 등 주요 대학에서도 AI 부정행위 속출 이 같은 AI 활용 부정행위는 비단 연세대만의 문제가 아니었다. 고려대학교에서도 지난 10월 말 교양과목 ‘고령사회에 대한 다학제적 이해’ 온라인 시험에서 집단 부정행위가 발생해 시험 자체가 전면 무효 처리되는 사태가 빚어졌다. 해당 강좌의 수강생 약 1,400명 중 무려 500여 명이 참여한 카카오톡 오픈채팅방에서 서로 답안을 공유한 사실이 확인된 것이다. 일부 학생들은 강의 자료를 AI에 입력해 답을 도출한 뒤 이를 제출하거나 다른 학생들과 공유하기까지 했던 것으로 알려져 충격을 더했다. 학교 측은 부정행위 적발 직후 해당 중간고사를 무효로 하고, 이후 치러질 기말고사는 모두 대면시험으로 진행하겠다고 공지했다. 또한 후속 조치로 학생들에게 과제물 제출 시 AI 탐지 프로그램인 이른바 ‘GPT 킬러’ 검사 결과 표절률 5% 미만을 충족하도록 요구하기도 했다. 그러나 이러한 조치에 대해 학생들은 “관리 부실에 대한 반성 없이 비현실적 기준을 강요한다”며 반발했다. 실제로 고려대 학생들은 익명 커뮤니티와 대자보를 통해 “비대면 시험에서 부정행위 가능성이 충분히 예견됐음에도 안일하게 대응한 교수진의 책임이 크다”면서, 사후에 GPT 탐지 5% 미만과 같은 엄격한 잣대를 들이대는 것은 “성실한 다수 학생을 잠재적 범죄자로 취급하는 처사”라고 성토했다. 이 과정에서 교수진의 공지문 자체가 AI 탐지기에 6% 표절률로 검출되었다는 사실까지 폭로돼 아이러니를 낳기도 했다.
최상위권 대학인 서울대학교에서도 AI 커닝 논란이 이어졌다. 지난 10월 서울대 자연과학대학의 교양과목 ‘통계학실험’ 중간고사(대면 시험)에서 일부 학생들이 사전 공지된 금지 규정을 어기고 AI를 사용한 정황이 나타나 학교가 조사에 나섰다. 해당 과목은 약 30명이 듣는 소규모 강의였지만, 시험 중 감독을 피해 휴대전화 등으로 AI 도움을 받아 문제를 푼 학생들이 확인된 것이다. 서울대는 이 중간고사 성적을 전면 무효 처리하고 재시험 실시를 검토하고 있으며, 유사 사례 방지를 위해 학부생들을 대상으로 ‘ChatGPT로 숙제해도 될까요?’라는 제목의 AI 활용 윤리 워크숍까지 예정보다 앞당겨 개최할 예정이다. 한편 중앙대학교에서도 대학원 석사과정 졸업시험에서 응시자 다수가 스마트폰으로 AI 답안을 참고한 의혹이 제기돼 논란이 확산됐다. 이 시험은 대면으로 치렀음에도 감독 부실로 인해 벌어진 일로, 학교는 해당 시험 감독을 조교 대신 교수로 교체하고 내부 규정을 강화하는 선에서 마무리했으나 재시험은 치르지 않아 일부에서 비판이 나왔다.
대학들의 대응과 학생들의 반응 잇따른 부정행위 적발에 대학들은 서둘러 대응책을 내놓고 있지만 혼선도 나타나고 있다. 연세대와 고려대는 부정행위가 발생한 과목의 시험을 무효화하고 즉각 오프라인 시험 원칙으로 전환하는 강수를 뒀으며, 재시험이나 성적 0점 처리 등의 조치를 통해 부정행위자에 대한 경고 메시지를 전달했다. 더불어 연세대는 학내 긴급 공청회를 열어 AI 활용 윤리교육과 평가방식 개선을 논의하는 등 제도 보완에 착수했고, 서울대 역시 학생 대상 워크숍을 마련해 올바른 AI 사용법과 시험 관리 방안을 모색하고 있다. 교육부 차원에서도 뒤늦게 움직임이 시작됐다. 교육부는 대학들의 AI 활용 부정행위 증가에 대응해 한국대학교육협의회와 함께 대학 AI 윤리 가이드라인을 개발하기로 결정했다. 이 가이드라인에는 시험 등 평가에서 AI 부정행위 금지를 명문화하고, 학생 간 불공정 격차를 줄일 수 있는 원칙과 사례별 대응 방안 등을 담겠다는 방침이다. 전문가들은 이러한 대책들과 함께 명확한 기준 정립과 평가 방식 혁신이 병행되어야 실효성이 있다고 지적한다. 현재 각 대학이 자체적으로 마련한 AI 활용 윤리 준칙이나 권고 사항만으로는 강제력이 미흡해 한계가 뚜렷하다는 것이다.
한편 학생들의 반응은 엇갈리고 있다. 부정행위에 연루된 일부 학생들은 “온라인 시험에서 거의 모두가 챗GPT를 쓰고 있다. 나만 안 쓰면 손해라는 생각이 든다”라고 토로해, 시험 환경 자체가 공정하지 못했다는 불만을 나타냈다. 실제로 한 대학생 커뮤니티에서 실시한 익명 설문 결과 응답자의 절반 이상이 온라인 시험 중 AI를 활용한 적이 있다고 답해, 학생들의 AI 활용이 이미 일상화되었음을 보여주기도 했다. 반대로 성실히 시험을 본 다수의 학생들은 집단 부정행위로 인해 성적이 무효화되거나 재시험을 치르게 되는 상황에 분노하고 있다. 고려대 부정행위 사태 당시 “정당하게 시험을 본 학생 입장에서는 억울하기 짝이 없다”는 호소가 나왔고, 일부 학교에서는 부정행위 적발 후 전원 재시험이 실시되어 성적을 잘 받았던 학생들이 피해를 입은 사례도 있었다는 증언이 나온다. AI 커닝 사태로 촉발된 이러한 불신과 갈등은 자칫 대학 공동체의 신뢰를 무너뜨릴 수 있다는 우려도 제기된다.
반복되는 부정행위… 드러난 온라인 평가 취약성과 구조적 문제 계속되는 사건의 이면에는 온라인 시험 시스템의 근본적 취약성과 대학 교육 구조상의 문제가 복합적으로 자리하고 있다는 지적이다. 코로나19 이후 비대면 강의와 온라인 평가가 확산했지만, 대학들은 그에 상응하는 시험 관리·감독 장치를 충분히 마련하지 못했다. 대규모 강의일수록 감독 인력과 기술적 통제에 한계가 뚜렷하고, 감독자가 없는 상황에서 학생들은 비교적 손쉽게 서로 연락을 주고받거나 AI 도구를 활용할 수 있다. 연세대 등 여러 대학에 출강했던 한 교수는 “수백 명이 온라인으로 시험을 치르면 이런 문제는 당연히 일어난다. 1차적인 책임은 학교에 있다”며, 대형 강의에서 부정행위 관리 소홀은 AI 등장 이전부터 꾸준히 지적돼온 고질적 문제라고 꼬집었다. 실제로 대학가에서 최근 적발된 부정행위 사례들을 보면, 수강생 규모가 큰 교양 과목에서 주로 발생했고, 시험 형태도 감독이 느슨한 온라인 객관식 퀴즈나 단답형 시험 등이었던 것으로 나타났다. 이는 곧 평가 설계의 허술함과 대학의 운영상 편의주의가 빚은 허점으로 지목된다.
생성형 AI 기술의 급격한 발전과 확산도 현 교육 현장의 뒤처진 대응을 여실히 드러냈다. 불과 1년여 만에 챗GPT를 비롯한 첨단 AI 챗봇과 구글의 ‘제미나이’ 등 새로운 도구들이 쏟아지며 학생들의 활용이 폭발적으로 늘었지만, 정작 대학들은 명확한 사용 지침이나 대비책을 마련하지 못한 채 혼란을 겪고 있다. 현재 대부분의 대학은 AI를 과제나 시험에 어디까지 허용하고 금지할지에 대한 통일된 기준조차 없는 상황이다. 어떤 교수는 자체적으로 “AI 활용 시 감점” 정도를 공지하는가 하면, 또 다른 교수는 차라리 “AI와 인터넷 모두 열어두고 시험을 보라”는 식으로 학생 자율에 맡기는 경우도 있다. 그러나 일반적으로는 AI 활용 여부를 탐지해낼 마땅한 방법이 없어 사실상 양심에 호소할 수밖에 없는 실정이다. 일각에서는 AI 검출 프로그램을 도입하고 있으나, 이러한 판독기의 정확도가 떨어져 억울한 오판 가능성이나 교묘히 피해가는 부정행위를 완벽히 걸러내기 어렵다는 문제도 지적된다.
나아가 이번 파문은 대학 교육이 본래의 학습 목적을 상실한 채 결과 중심으로 흐른 현실을 반영하는 것이라는 비판도 나온다. 국제학술 부정행위 방지 기구인 ICAI의 칼럼은 “AI는 넘치던 잔에 떨어진 마지막 한 방울일 뿐”이라고 비유하며, 부정행위 문제의 본질은 기술이 아니라 성적과 자격증만을 좇느라 학습의 목적을 잃어버린 교육 구조라고 지적했다. 우리 사회의 능력주의적인 성과 압박 속에서 학생들은 일단 좋은 성적만 얻으면 그만이라는 인식에 물들기 쉽고, AI는 그 과정을 손쉽게 대체해주는 수단이 되고 있다는 진단이다. 실제로 “과제를 할 때 AI를 안 쓰는 학생은 없다”는 자조적인 말이 나올 정도로 대학생들의 AI 이용은 광범위한데, 문제는 정작 무엇을 배우고 어떻게 사고할 것인지에 대한 고민이 사라진 채 결과물만 중시되는 풍토가 자리잡았다는 점이다. 교육 현장에서 반복되는 부정행위 사건들은 이러한 구조적 부실이 빚은 필연적인 결과라는 날선 평가가 제기되고 있다.
신뢰 회복을 위한 과제: 평가 혁신과 윤리 교육 잇따른 AI 커닝 사태에 교육계와 전문가들은 한목소리로 평가 방식의 혁신과 학습 윤리의 재정립을 촉구하고 있다. 먼저, 대안으로 제시되는 것은 기존의 획일적 시험에서 벗어나 AI 시대에 맞는 평가 형태로 전환하는 일이다. 예를 들어 시험을 전면 오픈북·오픈인터넷으로 전환하되 AI를 ‘동반자’로 활용하는 과제를 내어 학생들이 AI와 함께 문제 해결 능력을 기르는 방향으로 유도하는 방안이 논의되고 있다. 혹은 아예 구술시험이나 실습평가 등 AI가 대신할 수 없는 방식으로 평가를 다변화하자는 제언도 나온다. 실제로 일부 교수들은 글쓰기 과제의 경우 학생 개개인의 경험을 녹여내도록 문제를 내거나, 직접 실험·체험을 요구하는 프로젝트를 부여하는 등 AI가 따라할 수 없는 과제 디자인을 시도하고 있다. 이런 노력이 학생들의 자기주도적 사고와 학습 과정을 중시하는 평가 문화로 이어져야 한다는 것이다.
동시에 윤리의식 함양을 위한 교육 강화도 중요한 과제로 꼽힌다. 많은 대학이 AI 활용법을 가르치는 교과 개설을 검토 중이며, 일부 교수들은 “모든 대학에서 AI 사용법을 필수 과목으로 포함시켜야 한다”는 의견도 피력한다. 이는 단순히 AI 툴의 기술적 사용법뿐 아니라, 언제 어떤 방식의 사용이 윤리적이고 학습에 도움이 되는지를 가르치자는 취지다. 전문가들은 “감시와 처벌만으로는 한계가 있는 만큼, 학생들이 배움의 소중함과 정직성에 대해 스스로 깨닫도록 유도하는 교육적 접근이 필요하다”고 강조한다. 실제 연구에서도 학습에 감사하는 마음을 갖게 한 집단의 부정행위 발생률이 크게 낮아졌다는 결과가 있는 만큼, 교육 현장에서 성적 경쟁 위주의 분위기를 완화하고 학습 자체의 의미를 북돋우는 노력이 병행돼야 한다는 것이다.
이번 연세대발 AI 부정행위 논란은 대학 사회 전반에 경종을 울리며, 변화의 필요성을 강하게 제기하고 있다. 정직한 학생만 손해 보는 구조를 더 이상 방치해서는 안 된다는 자성의 목소리가 높다. 대학들은 기술 발전 속도에 뒤처지지 않는 평가 시스템을 갖추는 한편, 교육의 본질인 학습과 성장에 다시 집중하는 계기로 삼아야 할 것이다. AI 시대에 걸맞은 대학 교육의 새로운 틀을 마련하지 않는다면, 이러한 부정행위 논란은 언제든 재발할 수 있다는 것이 전문가들의 공통된 경고다. 학생과 교수, 대학 당국이 함께 머리를 맞대고 신뢰 회복과 교육 혁신을 이루어낼 지혜가 절실한 시점이다.
