[2025년 37째주] MetaX 주간 AI 동향 리포트
김한얼 기자
loenahmik@gmail.com | 2025-09-13 11:00:00
컴퓨팅 한계와 안전성, AI 시대의 새로운 과제로 부상
AI 업계 헤드라인 및 주요 발표
OpenAI는 영리법인으로의 구조조정을 추진하며 법무장관의 조사를 받는 등 큰 변화에 직면해 있다. 경영진의 불안감이 커지며 주 외부로의 이전 논의가 이어지는 가운데, OpenAI는 2029년까지 예상 현금 소진액이 1,150억 달러에 달할 것으로 전망되어 비용 통제를 위해 자체 데이터 센터 서버 칩과 시설을 개발할 계획이다. 이러한 재정적 압박 속에서 OpenAI는 2027년부터 5년간 Oracle과 3,000억 달러 규모의 컴퓨팅 파워 계약을 체결했는데, 이는 역사상 가장 큰 클라우드 계약 중 하나로 기록된다. Microsoft와의 파트너십은 연장될 예정이며, GPT-5 출시 후 OpenAI의 성장이 반등하여 5월 이후 처음으로 Anthropic을 추월했다.
Anthropic은 저작권이 있는 자료로 AI를 훈련하는 것은 합법적이지만, 불법 복제 사이트에서 자료를 획득하는 것은 불법이라는 연방 판사의 판결을 받았다. Microsoft는 OpenAI에 대한 의존도를 줄이기 위해 경쟁사인 Anthropic으로부터 AI를 구매할 예정이며, Claude는 Office 365 앱에 통합될 것이다. 또한, Claude는 앱에서 직접 문서, 스프레드시트, 슬라이드, PDF를 생성하고 편집하는 기능을 제공하게 되었다.
Databricks는 40억 달러의 연간 반복 매출(ARR)을 기록하며 1,000억 달러 이상의 가치를 확인하고 AI 에이전트용 데이터베이스에 추가 10억 달러를 투자할 계획을 밝혔다. Nvidia는 100만 토큰 이상의 긴 컨텍스트 창을 위해 설계된 새로운 GPU 'Rubin CPX'를 발표했으며, 2026년 말에 출시될 예정이다. ASML은 Mistral AI에 투자하며 Mistral의 최고 주주가 될 예정인데, 이 투자는 Mistral을 유럽에서 가장 가치 있는 AI 회사로 만들 것으로 기대된다. AI 코딩 플랫폼 Replit은 연간 매출이 1년도 안 되는 기간에 280만 달러에서 1억 5천만 달러로 성장했으며, 최소한의 인간 상호작용으로 자율적으로 작업하는 에이전트 'Agent 3'를 출시했다.
언어 모델의 환각(Hallucination)은 현재 평가 방법이 지식 부족을 인정하는 대신 무분별한 추측에 보상을 주기 때문에 지속된다. 이를 해결하기 위해서는 훈련 중 확실성에 기반하여 보상을 조정해야 한다. LLM 추론은 탐욕적인 디코딩에서도 부동 소수점 비연관성과 동시 실행으로 인해 비결정적인 상태로 남아 있다.
모든 진지한 AI 회사는 결국 자체 모델을 훈련할 것이며, 이를 위한 장벽은 점차 허물어지고 있다. 증류(Distillation), 미세 조정(fine-tuning) 등이 쉬워지고 있어, 곧 자체 모델을 소유하는 것이 관련성을 유지하는 유일한 방법이 될 것이다.
2020년 이후 AI 발전을 이끌었던 빠른 컴퓨팅 확장 시대는 끝났다. 대규모 클라우드 제공업체의 GPU는 거의 포화 상태이며, 최첨단 연구실들은 새로운 데이터 센터를 가동하고 가능한 한 많은 칩 생산을 확보하기 위해 경쟁하고 있다. 물리적 현실과 인프라 구축에 필요한 시간 때문에 확장이 지연되고 있어, 점진적 확장만이 유일한 옵션이다. 반도체 산업이 하락세에 접어들면 AI 부문에 상당한 타격을 줄 것이다.
AI 코딩 에이전트는 훌륭하지만 너무 낭비가 심하고, 데이터베이스의 컨텍스트를 유지하지 못하며, 컨텍스트 로테이션에 취약하다는 문제점이 있다. 이러한 문제들은 에이전트가 모든 함수에 대한 의미론적 이해와 컨텍스트를 가지고 있다면 해결될 수 있다.
Meta의 Set Block Decoding은 여러 미래 토큰의 병렬 샘플링을 가능하게 하여 정확도 손실 없이 디코딩 패스를 최대 5배까지 줄인다. ByteDance의 REER(REverse-Engineered Reasoning)은 알려진 정답으로부터 단계별 추론을 도출하는 새로운 패러다임이다. Alibaba는 1조 개 매개변수 모델인 Qwen3-Max-Preview를 발표했으며, 초기 벤치마크에서 성능 향상을 보였다.
분산 훈련을 위한 인프라 선택은 매우 중요하며, 네트워크 및 스토리지 구성은 쉽게 6-7배의 성능 차이를 만들 수 있다. OpenAI가 최근 출시한 GPT-OSS 모델 시리즈는 새로운 기술을 특징으로 하며 모델 로드, 실행 및 미세 조정을 매우 효율적으로 만든다.
Claude API의 새로운 웹 가져오기 도구는 프롬프트에 대한 응답의 일부로 URL에서 콘텐츠를 가져올 수 있다. 보안상의 이유로 이 도구는 이전에 대화 컨텍스트에 나타났던 URL만 가져올 수 있도록 제한된다. Mini-o3는 에이전트 시각적 추론을 위해 설계된 오픈 소스 모델로, OpenAI의 o3와 유사한 다중 턴 상호 작용을 지원한다.
[METAX = 김한얼 기자]
[ⓒ META-X. 무단전재-재배포 금지]