비원어민 학생과 교사에게 던지는 경고
AI 텍스트 탐지기가 비원어민(영어 비모국어) 작가들에게 불공정하게 작동한다는 사실이 밝혀지며, 교육 현장과 글로벌 커뮤니티에 경각심이 커지고 있다.
AI 탐지 기술은 공정한 평가와 부정행위 방지라는 목적과 달리, 언어적 다양성과 문화적 배경을 무시한 채 ‘억울한 피해자’를 양산하고 있다.
2023~2024년 미국·유럽 주요 대학에서 GPT 탐지기(예: Turnitin, OpenAI classifier 등) 사용이 빠르게 확산됐다.
GPT detectors are biased against non-native English writers(Liang et al. 2023)에 따르면, 이들 탐지기는 비원어민 영어 작성자의 글을 AI가 쓴 글로 오탐지할 확률이 네이티브에 비해 월등히 높았다.
실제로 일부 비원어민 학생들이 ‘AI 부정행위’로 억울하게 지목되거나, 자신의 순수 창작물이 “AI 작성” 판정을 받아 소명 과정에서 큰 심리적 고통을 겪는 사례가 다수 보고됐다.
AI 탐지기의 ‘편향’은 어떻게 발생하는가?
현재 대부분의 AI 탐지기는 ‘텍스트의 통계적 패턴’을 분석해 인간 작성/AI 작성 여부를 분류한다.
GPT류 대형언어모델은 더 단순하고 반복적이며, 문법적 오류가 적은 텍스트를 생성하는 경향이 있다.
그러나 영어 비원어민의 글도 네이티브에 비해 단순 문장 구조, 반복, 제한된 어휘 등이 나타나므로, AI 탐지기는 이를 ‘AI가 쓴 글’로 오판할 가능성이 매우 높다.
스탠퍼드·UC버클리 등 연구팀의 실험에 따르면, 대표적 AI 탐지기가 비원어민 영어 학습자의 에세이 61%를 AI가 쓴 글로 판정한 반면, 네이티브 에세이는 10% 미만의 오탐률을 보였다.
즉, AI 탐지기가 ‘글의 유창함/복잡성’을 인간성의 지표로 삼는 순간, 영어 비원어민은 구조적으로 불리한 위치에 놓이게 된다.
“나는 내 힘으로 썼다”는 비원어민 학생의 항변은 AI 탐지기의 ‘기계적 판단’ 앞에서 쉽게 무시당한다.
일부 대학에서는 AI 탐지기 판정만으로 ‘자동 F학점’, 심지어 징계 절차까지 진행하는 등, 학생의 권리가 심각하게 침해되고 있다.
교육 현장에서는 탐지기 오판으로 인해 신뢰 붕괴, 인종·언어적 소수자에 대한 차별 심화 등 부작용이 급증하고 있다.
전문가들은 “AI 탐지기가 오히려 교육적 불평등을 심화시킨다”며, ‘AI 탐지기 판정=절대적 진실’이라는 인식이 위험하다고 경고한다.
GPT 탐지기가 ‘상업적 도구’로 급성장하는 가운데, 오탐·편향 문제에 대한 개선 없이 무분별하게 도입되는 것은 새로운 형태의 ‘교육적 불공정’을 만들 수 있다.
GPT detectors are biased against non-native English writers(Liang et al. 2023) 연구는, AI 탐지기가 언어적 배경과 상관없는 보편적 솔루션이 될 수 없음을 실증했다.
추가적으로, 최근 AI 탐지기 공격·회피 연구(예: Recursive paraphrasing, spoofing attack)는 탐지기의 신뢰성 자체에 구조적 한계가 있음을 보여준다.
오탐지 문제는 단순 ‘정확도 저하’가 아니라, 비원어민 학생의 교육권·평가권, 나아가 인종적 형평성의 문제와 연결된다.
탐지기 자체에만 의존하는 시대는 끝나야 한다. 다면적 평가(질의응답, 구술 발표, 과정 평가 등)와 AI 리터러시 교육 강화가 필수적이다.
정책 차원에서는 AI 탐지기 오탐에 대한 이의신청 제도, 2차 판독 등 보호 장치 마련이 시급하다.
무엇보다, 글의 ‘질’과 ‘창의성’ 평가 기준이 오히려 언어 소수자를 배제하는 도구가 되지 않도록 국제적 협약과 윤리 가이드라인이 요구된다.
AI 탐지기는 ‘기술적 중립’이라는 환상을 버리고, 현실의 다양성과 불평등을 직시해야 한다.
기술은 교육적 신뢰를 강화할 수도, 반대로 취약한 집단을 더욱 고립시킬 수도 있다.
지금 필요한 것은 ‘탐지기의 성능 개선’이 아니라, 공정성과 포용성을 담보하는 평가·교육 시스템의 근본적 혁신이다.
[저작권자ⓒ META-X. 무단전재-재배포 금지]