[2025년 45째주] MetaX 주간 AI 동향 리포트

김한얼 기자

loenahmik@gmail.com | 2025-11-08 17:30:00

OpenAI·Anthropic의 천문학적 투자와 공격적 성장, GPT-5·Gemini 3 등 치열한 모델 경쟁
AGI 실현 전망 속 우주 데이터 센터 등 혁신적 인프라 확보 및 Siri·Gemini 애플리케이션 통합 가속

AI 기업의 재정, 전략 및 주요 파트너십

OpenAI와 Anthropic을 중심으로 한 주요 AI 기업들은 천문학적인 투자와 공격적인 성장을 계획하고 있다. Sam Altman은 OpenAI의 연간 수익 실행률이 200억 달러를 넘어섰으며, 미래 인프라 약정 지출액은 1조 4천억 달러에 달한다고 밝혔다. Altman은 회사가 이전에 보고된 연간 매출 130억 달러보다 훨씬 더 잘하고 있다고 말했으며, 2027년까지 1,000억 달러에 도달할 수 있다고 제안했다. 그러나 OpenAI의 최고 재무 책임자(CFO)인 Sarah Friar는 회사가 단기적으로 IPO를 계획하고 있지 않으며, 수익성 대신 성장과 R&D에 우선순위를 둘 것이라고 설명했다. OpenAI는 AI 칩의 감가상각률 불확실성으로 인해 자금 조달 비용이 증가하고 있음을 언급하며 정부의 지원을 희망하고 있다.

경쟁사 Anthropic은 더욱 빠른 매출 성장을 목표로 한다. Anthropic은 올해 API 매출이 38억 달러로 OpenAI의 예상 매출보다 두 배에 달할 것으로 예측하며, 2026년에는 연간 반복 수익(ARR) 200억~260억 달러를 목표로 한다. Anthropic은 2028년까지 현금 흐름이 양수(cash flow positive)가 될 것으로 예상된다. Google은 현재 Anthropic의 가치를 3,500억 달러로 평가할 수 있는 새로운 자금 조달 라운드에 대해 논의 중이며, 이는 추가 클라우드 컴퓨팅 서비스 제공이나 전환 사채를 포함할 수 있다. Amazon은 Anthropic 지분의 7.8%를, Google은 최대 8.8%를 소유하고 있는 것으로 알려져 있다.

인프라 확보를 위한 대규모 전략적 파트너십도 이어지고 있다. OpenAI는 Microsoft와의 독점 관계에도 불구하고 AWS와 7년 계약, 380억 달러 규모의 다년간 전략적 파트너십을 맺고 컴퓨팅의 상당 부분을 AWS로 이전하고 있다. 이 계약은 수십만 개의 Nvidia GPU에 즉시 접근하고 수천만 개의 CPU로 확장할 수 있도록 한다. Microsoft 역시 AI 수요 증가에 따른 컴퓨팅 부족 문제를 해결하기 위해 데이터 센터 운영업체 IREN과 97억 달러 규모의 클라우드 계약을 체결하여 Nvidia의 고급 칩에 접근했으며, 아랍에미리트(UAE)에 150억 달러 이상을 투자하여 Nvidia 칩의 UAE 진입을 위한 미국 수출 면허를 확보하고 데이터 센터 확장을 진행한다.

그림1. OpenAI CFO Sarah Friar (출처: OpenAI)

모델 개발, 성능 경쟁 및 애플리케이션 통합

선도적인 AI 기업들은 새로운 모델의 출시 시기를 맞추기 위한 치열한 경쟁을 벌이고 있으며, 오픈 소스 모델의 성능 또한 최첨단 수준에 도달하고 있다. OpenAI는 GPT-5.1 Thinking 모델 출시를 준비하고 있으며, 이는 ChatGPT 내 고급 추론 프로세스를 구동하는 백엔드 구성 요소에서 발견되어 GPT-5.1 출시가 임박했음을 시사한다. OpenAI는 Google의 곧 출시될 Gemini 3 Pro 출시 시기에 맞추려 할 가능성이 높다. Gemini 3 Pro 프리뷰 모델은 VertexAI 코드에 11-2025로 표시되며 11월 출시가 예상되며, Google은 또한 이미지 생성 및 AI 기반 크리에이티브 워크플로 전문가를 대상으로 하는 GEMPIX2 모델 (Nano Banana 2)의 출시도 준비 중이다.

중국의 Moonshot AI 팀이 개발한 오픈 소스 추론 모델인 Kimi K2 Thinking은 Humanitys Last Exam 및 BrowseComp와 같은 일부 벤치마크에서 선도적인 폐쇄형 모델을 능가하며, GPT-5 및 Claude Sonnet 4.5와 같거나 능가하는 성능을 보여준다. 이는 오픈 모델이 성능 면에서 폐쇄형 프론티어에 가장 근접한 순간이라는 평가를 받는다. 또한 Qwen3-Max-Thinking은 도구 사용 및 확장된 테스트 시간 컴퓨팅으로 증강될 때 AIME 2025 및 HMMT와 같은 까다로운 추론 벤치마크에서 100%를 달성한다.

AI 모델의 기능은 주요 소비자 및 엔터프라이즈 제품에 통합되고 있다. Apple의 Siri는 맞춤형 Gemini 기반 모델을 사용하여 개선될 예정이며, 이 모델은 Apple의 Private Cloud Compute 서버에서 실행되어 내년 3월에 출시될 것으로 예상된다. Google Gemini의 Deep Research 기능은 이제 AI 생성 보고서에 Gmail, Drive 및 Chat 데이터를 사용할 수 있도록 개인 작업 공간 데이터와 웹 검색을 통합한다. Perplexity는 회의 자동 기록, 에이전트 자동 참여, 세션 후 요약 전송 등 전문 팀의 미팅 문서화 및 후속 작업을 간소화하기 위한 미팅 자동화 도구를 개발 중이다.

그림2. Kimi K2 Thinking 모델의 Reasoning, Agentic Search, Coding 벤치마크 결과 (출처: Moonshot)

엔지니어링, 인프라 및 미래 전망

AI 기술의 발전 속도는 매우 빠르며, AGI 실현에 대한 전망과 이를 뒷받침하기 위한 혁신적인 엔지니어링 및 인프라 설계가 추진되고 있다. METR 데이터에 따르면 AI의 작업 완료 능력은 6개월마다 두 배로 증가하고 있으며, 이는 오늘날 2시간짜리 작업을 처리하는 모델이 1년 후에는 8시간 작업을, 18개월 후에는 전체 근무일 작업을 처리할 수 있음을 의미한다. Anthropic은 2027년 초까지 노벨상 수상급 AI를 달성하기 위해서는 AI가 2026년 12월까지 연구 엔지니어링을 완전히 자동화해야 한다고 예측하며, OpenAI는 AI 연구 자동화를 2028년 3월까지 예상한다.

AI 시스템을 위한 인프라는 지구 궤도까지 확장되고 있다. Google은 2027년에 AI 칩(TPU)을 탑재한 두 개의 위성을 발사할 예정이며, 2030년대 중반에는 태양광 패널이 궤도에서 최대 8배 더 효율적이기 때문에 우주 기반 데이터 센터가 더 비용 효율적일 것이라는 희망을 가지고 있다. 지상에서는 Google Cloud가 자체 Axion CPU 및 Ironwood TPU로 구동되는 새로운 AI 인스턴스를 도입하여 학습 및 저지연 추론을 목표로 하며, Perplexity는 수조 개의 매개변수를 가진 MoE 모델이 여러 AWS 서버에서 효율적으로 실행될 수 있도록 하는 코드를 공개하여 덜 발전된 데이터 센터도 AI 추론에 활용될 수 있게 했다.

AI 에이전트의 보안 및 효율성을 높이기 위한 엔지니어링 방법론 또한 발전하고 있다. Meta는 AI 에이전트의 프롬프트 주입 위험을 줄이기 위해 신뢰할 수 없는 입력 처리, 개인 데이터 접근, 외부 작업 수행이라는 세 가지 기능 중 두 가지만 허용하도록 제한하는 에이전트의 2의 규칙(Agents Rule of Two)을 제안했다. 또한 Cursor의 코딩 에이전트는 코드베이스에 대한 맞춤형 의미 검색(semantic search)을 통합하여 더 높은 정확도와 더 적은 사용자 상호작용을 통해 성능을 개선했다. 모델의 행동에 대한 흥미로운 연구 결과도 있는데, 도덕적 딜레마에 대한 10차례의 토론 후, GPT-5는 다시 질문을 받았을 때 54.7%의 확률로 입장을 바꿨다.

그림3. Agents Rule of Two (출처: Meta)

[METAX = 김한얼 기자]

[2025년 45째주] MetaX 주간 AI 동향 리포트

WEEKLY HOT