"학습인가 침해인가"… AI 저작권 전쟁과 데이터 주권
강석준 기자
camberev@gmail.com | 2025-03-28 06:21:12
최근 몇 년간, 인공지능(AI) 기술이 급속도로 발전하면서 각국 정부는 AI 패권을 차지하기 위한 경쟁에 돌입했다. 특히 미국과 중국은 AI 개발을 국가 경쟁력 강화와 전략의 핵심으로 삼고 있으며, 유럽연합(EU)과 일본 등도 자국의 산업 보호 및 AI 기술 경쟁력 강화를 위해 적극적인 정책을 펼치고 있다. 미국에서는 오픈AI(OpenAI)를 필두로 한 빅테크 기업들이 시장을 이끌고 있고, 중국에서는 최근 딥시크(Deepseek)의 등장과 함께 인공지능 개발 격차를 줄여나가며 미국을 따라잡고 있다. 이러한 빠른 흐름 속 미국은 최근 트럼프 행정부의 기조 아래 AI 산업의 성장을 방해하는 규제를 완화하는 방향으로 정책을 조정하고 있다.
2023년, 바이든 미국 전 대통령은 인공지능 기술에 대한 위험과 경각심을 논하며 인공지능 개발을 규제하는 행정명령을 내렸지만, 트럼프 대통령은 바이든의 접근 방식이 혁신과 발전에 대한 불필요한 장애물이라며 규제를 폐지하였다. 또한 AI 산업을 국가 경쟁력의 핵심 요소로 파악하고, 향후 대규모 투자와 인프라 구축을 선언하기도 하였다. 반면 유럽연합(EU)은 "인공지능법(AI Act)"을 통해 AI 개발에 윤리적 가이드라인을 적용하려는 움직임을 보이고 있다. 그러나 인공지능의 텍스트와 데이터 학습에 있어서 면책 규정을 제정하는 등 개발에 관대한 움직임을 보여주기도 하였다. 일본 역시 EU의 사례와 같이 AI의 데이터 학습에 대한 면책 규정을 도입하며 기술 개발을 지원하는 한편, 중국은 막대한 데이터를 바탕으로 AI 발전 속도를 가속화하고 있다.
AI 학습은 창작의 자유인가, 무단 복제인가
AI가 발전하기 위해서는 방대한 데이터 학습이 필수적이다. 챗GPT(ChatGPT)와 딥시크로 대표되는 생성형 AI 모델은 대량의 텍스트, 이미지, 음성 데이터를 분석하고 패턴을 학습함으로써 더욱 정교한 알고리즘을 만들어 낸다. 그리고 그 알고리즘을 통해 기존에 없던 새로운 산출물을 만들어낸다. 이 과정에서 수많은 인터넷 문서를 학습하는데, 필연적으로 저작권 보호 콘텐츠를 활용할 수밖에 없게 된다. 이러한 움직임에 반대하여 최근 AI 학습 데이터 중에는 기존의 창작물과 저작권이 보호된 콘텐츠가 포함되어 있어 법적 문제를 야기한다는 주장이 대두되고 있다.
생성형 AI의 학습 단계에서는 이미 만들어진 저작물을 수집하고 가공하게 되는데, 이 과정에서 저작권법에 따라 복제권과 전송권이 침해된다고 보는 견해가 있다. 반면, 생성형 AI의 학습에 관한 경우 기존의 전통적인 정보처리장치와는 다르게 인간의 학습과 유사한 형태를 띠기에, 실질적으로 원저작물의 창작자가 가지고 있는 저작권이 침해되지 않는다는 견해 또한 존재한다. 이에 관한 논쟁은 학습 단계에서보다는 생성형 AI가 만들어낸 결과물이 기존의 저작물과 유사할 경우에 더욱 첨예하게 대립한다.
본격적인 문제는 생성형 AI가 학습 과정 이후 산출해낸 결과물이 기존의 저작물과 유사한 경우 발생하는데, 이 문제에 대해 각국의 이익 집단은 소송도 불사하며 대립하고 있다. 가장 대표적으로, 미국의 대표 언론사 뉴욕 타임스와 오픈AI 간의 소송이 있었다. 지난 2023년, 뉴욕 타임스는 챗GPT가 별도의 허가와 동의 없이 자사의 뉴스를 학습해 훈련하였고, 빙(Bing)의 검색에도 이를 도입하고 사용하여 자사가 진행한 저널리즘 작업을 무단으로 가로챘다는 이유로 오픈AI와 마이크로소프를 상대로 저작권 침해 소송을 제기했다. 이 소송은 여전히 진행되고 있으며, 인공지능과 저작권 사이의 갈등을 수면 위로 끌어올려 사람들의 이목을 집중시킨 중요한 사건이었다.
이렇게 논쟁이 오가고 있는 와중에, 세계 각국의 정부는 인공지능의 학습에 데이터를 활용하는 데에 예외 조항을 두어 해결하고자 하고 있다. 저작권법 상 원저작자의 허락 없이 저작물을 사용하는 것은 저작자의 권리를 침해하는 것이지만, 기존의 모든 원칙을 준수하며 학습하기에는 인공지능이 불러오는 빠른 흐름에 뒤쳐질 수 있기 때문이다. 이와 같이 인공지능 산업 발전이 저해될 것이라는 우려의 목소리 또한 작지 않기에, 양측 간의 논란은 계속되고 있다.
"거부하지 않으면 동의"… 영국의 옵트아웃 논쟁과 음악가들의 무음 항의
영국 정부는 이러한 문제에 대한 해결방안으로 ‘옵트 아웃 시스템’을 제시했다. ‘옵트 아웃 시스템’이란, 정보 소유 당사자가 정보 수집을 명시적으로 거부할 때에만 정보 수집을 중단하는 방식의 제도이다. 즉, 무조건적 보호가 아닌, 명시적 거부에 한해서만 보호가 이루어진다는 뜻이다. 영국 정부의 결정에 영국 내 음악 및 예술계에서 큰 반발이 일어나고 있다. 이번 2월, 영국의 유명 음악가 케이트 부시, 락밴드 블러(Blur)의 데이먼 알반 등 1,000명 이상의 음악가들은 ‘Silent Album(무음 앨범)’을 발매했다. 앨범의 러닝타임 내내 아무 소리도 들리지 않는 이 앨범은 빅테크 인공지능 기업들이 저작권 보호 작품을 허가 없이 사용할 수 있도록 하는 영국 정부의 계획에 대한 항의 표시이다.
그들은 AI가 창작자의 권리를 침해할 가능성에 대해 강한 우려를 표하고 있다. 영국의 음악가, 예술가 단체들은 AI 기업이 무단으로 콘텐츠를 학습하는 것을 막기 위해 법적 조치를 요구하고 있으며, AI가 생성한 콘텐츠가 원작자의 스타일을 무단 도용하는 문제를 제기하고 있다.
한편 미국의 경우 구글, 오픈AI 등의 빅테크 기업이 트럼프 대통령에게 직접 저작권 규제를 완화할 것을 요청하고 있다. 이들 역시 AI 기술 발전이 국가 경쟁력 유지에 필수적이며, 데이터 학습 제한이 미국 기업을 중국과의 경쟁에서 불리하게 만들 수 있다고 주장하고 있다.
트럼프 행정부는 이러한 빅테크 기업들의 요구를 수용하는 방향으로 정책을 조정하고 있으며, AI 개발을 촉진하기 위한 규제 완화 조치를 추진 중이다. 특히, AI 학습 과정에서 저작권이 있는 자료를 공정 이용의 범위로 포함시키는 방안을 검토하고 있다. 그러나 영국의 예술계와 마찬가지로 할리우드와 출판업계 등은 이에 강하게 반발하고 있으며, AI가 저작물을 학습할 경우 반드시 창작자에게 보상을 제공해야 한다는 입장을 고수하고 있다.
한국의 갈림길: TDM 면책과 저작물 공개 의무 사이
한국 또한 인공지능의 저작권 문제에 대한 논의가 활발하다. 저작권법 상 AI의 학습데이터에 활용하기 위한 저작물의 무단 복제와 전송이 불가하기에, 국내의 대기업, 스타트업 등 인공지능 관련 기업은 모두 인공지능 학습에 있어 어려움을 겪고 있다. 이에 따라 EU와 일본과 마찬가지로 TDM(Text and Data Mining) 면책조항 도입을 고려하고 있다. TDM 면책조항이란, 인공지능이 텍스트와 데이터 학습을 하는 데에 있어 저작권법을 침해하는 행위가 있더라도 예외로 두는 조항이다. 지난 2021년 저작권법 개정안이 발의되었을 때 면책조항이 삽입되었지만, 실질적인 상황에 도움이 되지 않을뿐더러 입법화가 지연되고 있기에, 효력을 발휘하고 못하고 있다.
한국의 역시 인공지능의 데이터 활용에 있어서 마냥 긍정적이지만은 않다. 한국신문협회와 한국기자협회를 비롯한 5개의 언론단체는 인공지능 학습에 있어 입력되는 데이터와 사용되는 저작물을 의무적으로 공개해야 한다고 주장했다. 문화체육관광부 또한 이번 1월 저작권법 개정을 통해 AI 학습에 활용된 데이터 목록을 의무적으로 공개하도록 할 것이라 밝혔다.
데이터 주권과 창작의 권리, 공존을 위한 해법은?
인공지능과 저작권 문제는 단순히 법적인 논쟁을 넘어 원저작자와 인공지능 간의 균형을 맞추는 것이 핵심이다. 인공지능의 학습과 새로운 산출물, 그리고 창작자의 권리를 보호하는 문제는 향후 AI 규제 정책에서 가장 중요한 논쟁 중 하나로 남을 것이다.
각국 정부는 인공지능 기술의 발전과 창작자의 권리 보호 사이에서 균형을 맞추기 위한 정책을 마련해야 하며, 공정한 보상 체계를 구축함으로써 AI와 창작자 간의 협력을 강화해야 한다.
향후 국제적으로 AI 저작권 관련 표준이 마련될 가능성이 있으며, 이에 따라 창작자 보호와 AI 발전이 공존할 수 있는 방향으로 나아가도록 지속적인 논의와 법적 검토가 필요할 것이다.
[ⓒ META-X. 무단전재-재배포 금지]