[8월 첫째 주] AI 기술 동향 : 글로벌 기업들의 AI 패권 경쟁

김한얼

metax@metax.kr | 2025-02-16 13:32:16

지난 한 주간 인공지능(AI) 분야에서는 생성 AI (Generative AI) 분야의 약진이 두드러집니다. 단순한 기술 발전을 넘어, 기업 간 합종연횡, 치열한 속도 경쟁, 그리고 윤리 및 안전 문제, 플랫폼 독과점 논란까지, 다양한 이슈들이 얽히고설키며 역동적인 양상을 보여주고 있습니다.

출처: Stability AI사의 Stable Fast 3D

생성 AI 모델 경쟁 심화

글로벌 기업들의 AI 패권 경쟁: 오픈소스 vs 독점 모델, 성능과 윤리의 균형

오픈AI의 GPT-4가 독점적 훈련 데이터를 바탕으로 여전히 최고의 성능을 자랑하지만, 구글의 제미나이, 메타의 라마, 알리바바의 큐원 등 오픈소스 모델들의 성능 또한 빠르게 향상되고 있습니다. 특히, 환각 현상을 줄이는 데 있어 오픈소스 모델들이 비용 장벽 없이 꾸준히 발전하고 있다는 점이 주목할 만합니다.

테크크런치에 따르면, 메타는 차세대 대규모 언어 모델(LLM)인 라마 4 훈련에 라마 3.1보다 10배 많은 GPU를 투입할 계획을 발표했습니다. 이는 약 16만 개에 달하는 GPU 클러스터를 구축하겠다는 것으로, 세계 최대 규모의 슈퍼컴퓨팅 인프라 구축을 의미합니다. 메타는 연말까지 GPU 비축량을 60만 개까지 늘릴 것으로 예상됩니다. 메타는 현재 'Llama' 모델을 오픈 소스로 공개하며 개방형 생태계 구축에 힘쓰고 있습니다. 특히 저커버그 CEO는 애플과 같은 폐쇄적인 기업들을 공개적으로 비판하며 오픈 소스 전략의 당위성을 강조하고 있습니다.

더버지에 따르면, 틱톡은 오픈AI 모델에 접근하기 위해 마이크로소프트(MS)에 매달 2,000만 달러(약 270억 원)를 지불하고 있는 것으로 알려졌습니다. 이는 MS의 애저 오픈AI 서비스 월 매출의 약 25%에 달하는 금액입니다. 그러나 지난해 틱톡의 모회사인 바이트댄스가 오픈AI의 기술을 무단으로 사용하여 자체 AI 모델을 개발한 사실이 드러나 오픈AI가 바이트댄스의 계정을 정지시켰던 사건이 있었기에, 틱톡이 여전히 오픈AI 기술을 사용하고 있다는 사실에 의혹이 제기되고 있습니다.

월스트리트 저널에 따르면, MS는 최근 연례 보고서에서 오픈AI를 경쟁자 목록에 추가했습니다. MS는 챗GPT 제작사인 오픈AI를 "AI 제공 및 검색, 뉴스 광고 경쟁자"로 명시했습니다. 이는 오픈AI가 자체 검색 엔진인 서치GPT를 출시한 이후 이루어진 조치로, MS의 빙 검색 엔진과의 경쟁이 불가피해졌기 때문입니다. MS의 개발자 플랫폼인 깃허브(GitHub)는 개발자들이 애플리케이션에 통합할 다양한 AI 모델을 테스트할 수 있는 대화형 샌드박스 플랫폼인 깃허브 모델(Github Model)을 출시했습니다. 깃허브 모델은 메타의 라마 3.1, 오픈AI의 GPT-4o 및 GPT-4o 미니, 코히어의 커맨드, 미스트랄의 라지 2 등 다양한 인기 모델을 무료로 이용하고 테스트할 수 있는 환경을 제공합니다.

LLM 내부 작동 원리를 파악하고 설명하려는 시도도 계속되고 있습니다. 구글 딥마인드는 '희소 오토인코더(SAE)'를 사용한 'JumpReLU SAE' 아키텍처를 공개하며 LLM 해석 가능성을 높였습니다. SAE는 오픈 AI와 앤트로픽도 사용하는 기술로, 복잡한 신경망에서 핵심 특징을 추출하여 모델의 동작 방식을 분석하는 데 도움을 줍니다. 특히 'GPT-4'에서 1600만 개의 특징을 찾아낸 사례는 주목할 만합니다.

바이두는 LLM이 스스로 판단을 내리고 그 결과를 비판적으로 검토하여 정확성을 높이는 '자기 추론 (Self-Reasoning)' 프레임워크를 공개했습니다. 이는 기존 LLM보다 적은 데이터로도 뛰어난 성능을 발휘하며, 특히 높은 정확도와 신뢰성이 요구되는 금융, 의료 등의 분야에서 유용하게 활용될 것으로 기대됩니다.

이미지 생성 AI 분야에서는 더 빠르고 저렴한 비디오 생성이라는 두 마리 토끼를 잡기 위한 경쟁이 치열합니다. 런웨이는 'Gen-3 Alpha Turbo'를 출시하며 11초 만에 10초 분량의 영상을 만들 수 있다고 밝혔습니다. 스테빌리티 AI는 0.5초 만에 3D 이미지를 생성하는 'Stable Fast 3D' 모델을 선보이며 디자인, 건축, 게임 개발 등 다양한 분야에서의 활용 가능성을 제시했습니다.

멀티모달 AI의 진화

멀티모달 AI의 진화: 음성 인식의 감성 탑재와 AR의 실용적 응용

오픈AI는 GPT-4o의 음성 모드를 일부 유료 사용자에게 공개했습니다. 새로운 음성 모드는 멀티모달 모델을 적용하여 텍스트와 음성 간 변환을 단일 모델에서 처리하여 응답 속도를 크게 향상시켰습니다. 또한, 슬픔, 흥분 등 목소리의 감정적 뉘앙스를 감지할 수 있는 기능도 추가되었습니다.

테크레이더에 따르면, 메타는 혼합현실(MR) 헤드셋인 퀘스트 3에서 가구 배치를 돕는 새로운 AR 앱 레이아웃(Lay-out)을 출시했습니다. 레이아웃은 헤드셋을 착용하고 집 안의 가구를 바라보면 크기를 자동으로 측정하여 표시해 주는 앱입니다.

AI 기술의 진보와 사회적 파장: 최신 동향과 쟁점

AI의 혁신과 도전: 저작권, 기술 발전, 윤리적 딜레마의 교차점

와이어드에 따르면, 음악 생성 AI 분야에서는 저작권 문제가 뜨거운 감자로 떠올랐습니다. 유니버설 뮤직 그룹, 소니 뮤직 엔터테인먼트 등 글로벌 음반사들은 수노를 상대로 저작권 침해 소송을 제기했습니다. 수노는 '공정 사용'을 주장하며 맞고소로 대응했지만, AI 시대의 저작권 문제는 앞으로도 계속 논쟁거리가 될 것으로 보입니다.

조지아공과대학 연구진은 중요한 정보와 그렇지 않은 정보를 구분하여 처리하는 RTNet(Response Time Network)이라는 새로운 AI 프레임워크를 개발했습니다. RTNet은 인간의 지각적 의사결정과 유사한 방식으로 이미지를 처리하는데, 쉬운 이미지는 빠르게, 복잡한 이미지는 시간을 들여 처리하여 효율성을 높입니다.

AI 모델에서 학습한 특정 데이터를 삭제하는 언러닝 기술이 모델의 전반적인 성능을 저하시킨다는 연구 결과인 MUSE가 발표되었습니다. 워싱턴대학교, 프린스턴대학교, 시카고대학교, USC, 구글 연구진은 공동 연구를 통해 언러닝 기술이 AI 모델의 일반적인 질문-응답 능력을 저하시킨다는 사실을 확인했습니다.

CNBC에 따르면, 구글은 최근 AI 모델 제미나이를 사용하여 제작한 올림픽 광고가 인간의 창의성을 폄하한다는 비판을 받고 광고를 철회했습니다. 이 광고는 제미나이가 어린이 팬레터를 대신 작성해 주는 내용을 담고 있었는데, 팬레터가 지닌 인간적인 감정과 의미를 제대로 담아내지 못했다는 비판을 받았습니다.

AI 규제 논의

AI 규제의 진화: 국내 기본법 정비와 글로벌 시장 감시

22대 국회에서 6건의 AI 기본법안이 발의되었으며, 추가 법안 발의도 예상됩니다. 정부는 고위험 AI에 대한 명확한 정의 및 가이드라인을 마련하고 있으며, AI 안전 연구소 설립을 통해 기술적 지원을 제공할 계획입니다.

영국 경쟁시장청(CMA)은 구글과 AI 스타트업 앤트로픽과의 파트너십 계약을 조사하고 있습니다. CMA는 이번 제휴가 합병으로 간주될 수 있는지, 영국의 시장 경쟁에 부정적인 영향을 미치는지 여부를 검토하고 있습니다.

시사점

지난 일주일 동안 AI 분야에서는 오픈소스 모델의 약진, 멀티모달 AI의 진화, AI 윤리 및 규제 논의 등 다양한 이슈가 주목을 받았습니다. 특히, 오픈AI의 독주 속에서도 구글, 메타 등의 경쟁사들이 기술 개발에 박차를 가하고 있어 앞으로 AI 시장의 경쟁은 더욱 치열해질 것으로 예상됩니다. 또한, AI가 만들어내는 사회적 영향에 대한 우려도 커지고 있어, AI 윤리 및 규제에 대한 논의는 더욱 중요해질 것으로 보입니다.

[8월 첫째 주] AI 기술 동향 : 글로벌 기업들의 AI 패권 경쟁

WEEKLY HOT