[2025년 40째주] MetaX 주간 AI 동향 리포트

김한얼 기자

loenahmik@gmail.com | 2025-10-04 11:00:00

Sora 2·Claude 4.5 등 치열한 AI 모델 경쟁 속 커머스 기능까지 탑재하며 확장하는 플랫폼 생태계
기업 전략과 개발자 도구부터 AI 과학자·업무 활용까지, 전방위로 확산되는 최신 AI 기술 동향

새로운 AI 모델 및 제품 출시

OpenAI는 향상된 물리적 사실성과 제어 능력을 갖춘 비디오 생성 모델 Sora 2를 선보이며 기술의 지평을 넓혔다. Sora 2는 단순한 영상 생성을 넘어, 새로운 앱 인터페이스를 통해 동기화된 대화와 음향 효과까지 지원하며 한층 더 몰입감 있는 경험을 제공한다. 이에 맞서 Anthropic은 코딩과 추론 능력에서 최고점을 기록한 Claude Sonnet 4.5를 공개했다. 이 모델은 개발자들을 위한 Claude Agent SDK, Chrome 확장 프로그램 등 강력한 생태계를 함께 선보이며 사용자 편의성을 극대화했다.

이러한 거대 모델들의 경쟁 속에서 특정 기능에 특화된 새로운 제품들도 속속 등장했다. Perplexity는 AI 네이티브 브라우저인 Comet을 공식 출시하며 기존의 웹 검색 경험을 재정의하고자 했다. DeepSeek 또한 코드 에이전트 기능을 강화하고 다국어 처리 능력을 개선한 DeepSeek-V3.1-Terminus와 긴 컨텍스트 처리 효율을 높인 DeepSeek-V3.2-Exp를 연이어 공개하며 기술적 깊이를 더했다. Google 역시 Gemini 2.5 Flash Image 모델을 정식 출시하며 이미지 생성 시장에서의 경쟁력을 강화했다.

기존 플랫폼들은 AI 기능을 통합하여 서비스 영역을 확장하는 데 주력했다. ChatGPT는 사용자가 플랫폼 내에서 직접 상품을 구매할 수 있는 '즉시 결제' 기능을 도입하며 커머스 영역으로의 진출을 알렸다. Anthropic 또한 사용자가 맞춤형 지침을 공유할 수 있는 'Skills' 기능을 개발 중이라고 밝히며, AI를 더욱 개인화된 도구로 만들려는 노력을 보여주었다. 이러한 움직임은 AI가 단순한 정보 생성 도구를 넘어, 실생활의 다양한 작업을 수행하는 핵심 플랫폼으로 진화하고 있음을 시사한다.

그림1. Sora 2 출시 (출처: OpenAI)


기업 동향 및 전략

OpenAI는 아직 흑자를 내지 못함에도 불구하고 직원들의 주식 매각을 통해 5천억 달러라는 경이로운 기업 가치를 인정받으며 시장의 기대를 한 몸에 받고 있다. 한편, Meta는 외부 기술에 대한 의존도를 줄이고 자체 AI 역량을 강화하기 위해 칩 스타트업 Rivos를 인수하는 과감한 결정을 내렸다. 이는 AI 인프라의 수직적 통합을 통해 장기적인 경쟁 우위를 확보하려는 전략적 포석으로 분석된다.

기업 내부적으로는 리더십 교체와 전략적 방향성에 대한 고민이 깊어지고 있다. Anthropic은 증가하는 수요에 대응하고 인프라를 확장하기 위해 전 Stripe CTO를 새로운 최고 기술 책임자로 영입하며 조직을 재정비했다. 반면 OpenAI 내에서는 비디오 피드 서비스인 Sora 2의 소셜 미디어화 추진을 두고, 회사의 비영리적 사명과 상업적 성공 사이에서 내부적 갈등이 표출되기도 했다. 이는 AI 기업들이 기술 개발뿐만 아니라 사회적 책임과 정체성에 대해서도 깊이 고심하고 있음을 보여준다.

플랫폼 전략과 사용자 안전 정책 역시 주요 화두로 떠올랐다. Apple은 Siri의 성능 향상을 위해 'Veritas'라는 코드명의 챗봇을 내부적으로 테스트하며 차세대 AI 비서 시장을 준비하고 있다. OpenAI는 민감한 주제에 대한 대화 시 사용자를 자동으로 안전한 모델로 전환하는 시스템을 테스트하고 있음을 인정하며, AI의 안전성 확보에 대한 노력을 강조했다. 또한 Slack은 AI 에이전트가 직장 내 대화 데이터에 직접 접근할 수 있도록 플랫폼을 개방하며, 자사를 모든 업무용 소프트웨어의 AI 허브로 만들겠다는 야심 찬 비전을 드러냈다.

그림2. Rivos의 Multi-chiplet SoCs (출처: Rivos)


개발자 도구 및 엔지니어링

AI 기술의 대중화를 위해 개발자들의 편의성을 높이는 도구와 라이브러리 출시가 이어지고 있다. Thinking Machines Lab의 Tinker API는 복잡한 인프라 설정 없이도 대규모 언어 모델을 미세 조정할 수 있게 해주며, Anthropic의 Claude Agent SDK는 코딩을 넘어 금융, 고객 지원 등 다양한 분야의 AI 에이전트를 손쉽게 구축할 수 있는 환경을 제공한다. 또한 Google의 Jules Tools는 개발자가 기존 작업 환경을 떠나지 않고도 명령줄 인터페이스를 통해 AI 코딩 에이전트를 활용할 수 있게 하여 개발 생산성을 한 단계 끌어올렸다.

더 깊은 수준에서는 AI 모델의 성능을 극한으로 끌어올리기 위한 엔지니어링 연구가 활발히 진행 중이다. NVIDIA GPU에서 행렬 곱셈 연산을 최적화하는 커널 설계 기술에 대한 상세한 분석이 공개되는가 하면, 모델의 가중치를 특정 기하학적 곡면에 제한하여 훈련 안정성을 높이는 '모듈식 매니폴드'와 같은 새로운 훈련 방법론이 제안되었다. 또한, 모델 미세 조정의 표준 기법인 LoRA를 최적으로 활용하여 훨씬 적은 비용으로 전체 미세 조정과 동일한 성능을 내는 방법론도 공유되었다.

이러한 발전은 견고한 기반 라이브러리와 프레임워크가 뒷받침하기에 가능하다. JAX 네이티브 라이브러리인 Tunix는 사전 훈련된 모델을 실제 서비스에 사용할 수 있는 수준으로 만드는 복잡한 과정을 단순화하여, 특히 TPU 환경에서의 개발 효율을 높였다. 엔지니어링 커뮤니티는 Flash Attention 4와 같은 핵심 컴포넌트의 작동 원리를 리버스 엔지니어링하며 분석하고, DSPy와 같은 프로그래밍 모델의 가정과 한계를 논의하는 등, 기술의 근간을 더욱 단단하게 다져나가고 있다.

그림3. Flash Attenion 4 리버스 엔지니어링 (출처: Modal)


AI 연구 및 응용 사례

전 OpenAI 및 DeepMind 연구진이 설립한 Periodic Labs는 AI가 로봇을 제어하여 초전도체와 같은 신소재 발견을 위한 물리 실험을 자율적으로 수행하는 'AI 과학자'를 목표로 연구를 진행하고 있다. DeepMind의 AlphaEvolve 프로젝트는 한 걸음 더 나아가, LLM을 활용해 복잡성 이론의 새로운 수학적 정리를 증명하는 코드를 스스로 '진화'시킴으로써 AI가 인간의 지적 파트너가 될 수 있음을 입증했다.

산업별 맞춤형 응용 사례도 빠르게 증가하고 있다. 사이버 보안 분야에서는 Claude Sonnet 4.5와 같은 AI 모델이 방어자들을 위한 효과적인 도구로 활용되고 있으며, Anthropic은 해커들의 악용을 막고 방어 능력을 강화하는 데 적극적으로 투자하고 있다. 디자인 영역에서는 Google DeepMind가 특정 스타일을 유지하면서도 새로운 콘셉트를 탐색할 수 있는 맞춤형 이미지 생성 모델을 구축하여 프로토타이핑 과정의 효율성과 창의성을 높이고 있다. 이처럼 AI는 각 분야의 특화된 전문가를 보조하는 역할을 톡톡히 해내고 있다.

이러한 전문 분야의 활용을 넘어, AI는 이미 일상적인 업무 환경 깊숙이 자리 잡고 있다. OpenAI의 보고서에 따르면 미국 근로자의 28%가 직장에서 ChatGPT를 사용하고 있으며, 특히 기술 직군에서 그 활용도가 두드러진다. 이는 AI가 소수의 전문가를 위한 도구가 아니라, 정보와 지식을 다루는 모든 현대인의 생산성을 향상시키는 보편적인 기술로 자리매김했음을 명확히 보여주는 증거다.

그림4. periodic labs 로고 (출처: periodic labs)


[METAX = 김한얼 기자]

[ⓒ META-X. 무단전재-재배포 금지]

WEEKLY HOT