NYT, 퍼플렉시티에도 저작권 소송..."언론과 AI 검색 정면 충돌"

X 기자

metax@metax.kr | 2025-12-09 07:00:00

‘RAG 모델 규제’가 본격 핵심 쟁점으로 부상

뉴욕타임스(The New York Times·NYT)가 AI 검색 스타트업 퍼플렉시티(Perplexity)를 상대로 저작권 침해 소송을 제기하며, 생성형 AI 시대 언론사의 저작권 보호 전쟁이 새로운 단계로 접어들었다.

NYT는 이미 OpenAI와 마이크로소프트를 상대로 대규모 소송을 진행 중이며, 이번 소송은 언론사와 AI 기업 간 갈등이 일시적 현상이 아니라 산업 구조를 둘러싼 근본적 충돌임을 보여준다.

NYT는 소장에서 퍼플렉시티가 “허락 없이 뉴욕타임스의 뉴스 콘텐츠를 수집·요약·재배포해 이용자에게 제공하고, 이를 통해 상업적 이익을 취하고 있다”고 주장한다.

특히 퍼플렉시티가 제공하는 검색·요약 응답은 “NYT의 기사 원문과 지나치게 유사하거나, 때로는 거의 그대로 재현되는 수준”이라며, 이는 언론사가 막대한 비용을 들여 생산한 보도물을 사실상 대체하는 행위라고 지적했다.

소송의 핵심 기술적 쟁점은 퍼플렉시티의 RAG(Retrieval-Augmented Generation) 방식이다. RAG는 AI가 실시간으로 웹페이지나 데이터베이스를 검색한 뒤, 그 내용을 요약·재구성해 사용자에게 답변하는 기술이다.

언론계는 이 기술이 “기사의 구조와 문장을 그대로 반영하는 요약물을 생성해, 원래 기사에 대한 구독·접근을 방해한다”며 심각한 저작권 침해 요소가 있다고 비판해 왔다. NYT는 퍼플렉시티가 페이월 뒤에 있는 콘텐츠까지 무단으로 이용했다고 주장하며 문제의 심각성을 강조했다.

또한 NYT는 퍼플렉시티의 검색 결과가 종종 잘못된 정보(할루시네이션)를 생성하면서도 이를 뉴욕타임스가 작성한 것처럼 잘못 인용한 사례가 있다며, 이는 브랜드 신뢰도에 직접적인 손상을 준다고 밝혔다.

이번 소송은 단순한 법적 분쟁을 넘어, 언론과 AI 기업 간 콘텐츠 라이선스 체계 정립이라는 구조적 문제와 직접 연결된다.

NYT는 이미 여러 AI 기업과 정식 라이선스 계약을 논의 중이며, 아마존에는 학습용 기사 데이터를 유료로 제공하는 장기 계약을 체결한 바 있다. AI 기업들도 콘텐츠 사용에 대한 논란을 줄이기 위해 퍼블리셔 프로그램을 도입하거나(퍼플렉시티), 언론사와의 정식 라이선스 계약(OpenAI–AP·Axel Springer 등)을 확대하고 있다.

그러나 퍼플렉시티는 이러한 라이선스 체계에 참여하지 않은 상태에서, 언론사가 콘텐츠를 무단으로 크롤링했다고 주장받는 몇 안 되는 주요 AI 기업 중 하나로 남아 있다. 

전문가들은 이번 소송이 AI 산업의 핵심 규제 논쟁을 다시 촉발할 것으로 보고 있다.

RAG 기술을 통해 유료 콘텐츠를 요약·재배포하는 행위가 공정 이용(fair use) 에 해당하는지, 또는 명백한 저작권 침해인지가 가장 중요한 쟁점이다. 여기에 AI가 잘못된 정보를 생성했을 때 그 책임이 누구에게 있는지, AI가 언론사의 경제 기반(광고·구독)을 침식할 경우 어떤 제도적 대응이 가능한지 등 복잡한 논의도 뒤따를 전망이다.

시카고 트리뷴, WSJ를 보유한 News Corp, Nikkei, Britannica, Reddit 등 이미 여러 언론사가 퍼플렉시티를 상대로 소송 또는 비판을 제기하며 압박 수위를 높이고 있다. 이번 뉴욕타임스 소송은 이 압박을 정점으로 끌어올릴 가능성이 크다.

생성형 AI가 정보 탐색과 뉴스 소비 방식을 근본적으로 재편하는 상황에서, 이번 소송은 “AI 검색의 시대에 저작권은 어떻게 보호되는가?”라는 질문을 다시 제기한다.

뉴욕타임스가 던진 이 문제 제기는 퍼플렉시티뿐 아니라 구글, OpenAI, Anthropic 등 모든 AI 검색·요약 서비스에 직간접적인 파장을 미칠 것으로 보인다.

[ⓒ META-X. 무단전재-재배포 금지]

WEEKLY HOT