[2025년 19째주] MetaX 주간 AI 동향 리포트
김한얼 기자
loenahmik@gmail.com | 2025-05-11 11:00:51
생활 속으로 파고드는 AI 에이전트와 산업 생태계의 변화
글로벌 AI 경쟁 구도가 다각화되면서 중국(알리바바)과 미국(구글, 오픈AI) 기업들 간의 모델 성능 경쟁이 심화되고 있으며, AI 에이전트 기술이 빠르게 상용화 단계에 진입하고 있다. 기업들의 82%가 향후 3년 내 AI 에이전트 도입을 계획하는 가운데, 생성형 AI 기술은 쇼핑, 언어 학습, 프레젠테이션 제작 등 실생활 서비스로 확장되고 있다. 이러한 급속한 발전 속에서 대규모 투자와 기업 구조 재편이 진행되는 한편, 과도한 아첨 행동과 같은 AI 안전 문제와 사이버 범죄 활용 가능성이 새로운 윤리적·보안적 과제로 대두되고 있다.
Alibaba는 'Qwen 3'이라는 하이브리드 AI 추론 모델 제품군을 공개했으며, 이 모델은 혼합 전문가 아키텍처를 채택해 Google과 OpenAI의 최고 모델들과 경쟁할 수 있는 수준에 도달했다. Qwen 3은 119개 언어를 지원하고 36조 토큰으로 학습되었으며, 특정 벤치마크에서는 OpenAI의 o3-mini를 능가하는 성능을 보였다.
Microsoft의 Phi 4 모델은 사립 대학원 선형 대수학 시험에서 100% 추론 성능을 보여 로컬 수학 및 코드 처리 분야에서 탁월한 역량을 증명했다. Mistral Medium 3는 기업 환경에서 비용 효율성과 강력한 성능을 함께 제공하며, 특히 배포 유연성과 코딩 작업에 최적화되어 있다.
Google은 Gemini 2.5 Pro의 프리뷰를 출시했는데, 이 모델은 웹 앱 구축, 코드 변환, 멀티모달 추론 분야에서 향상된 성능을 보여주고 있다. 더불어, Google 연구진은 LLM을 활용해 복잡한 텍스트를 단순화하는 연구를 진행 중이며, 'IDInit'이라는 새로운 초기화 기법을 통해 심층 신경망에서 안정적인 수렴을 보장하고 있다.
Anthropic은 Claude 모델용 웹 검색 API를 출시하여 실시간 웹 정보를 활용할 수 있게 함으로써 최신 정보 제공 능력을 크게 강화했다. 이 기능은 모든 유료 Claude 플랜에 적용되었다.
Apple은 Anthropic과 협력하여 Xcode에 통합될 차세대 내부 코딩 비서를 개발 중인 것으로 알려졌다. 또한 Safari에 Perplexity 및 Claude와 같은 AI 검색 엔진 통합을 고려하고 있어, LLM 기반 검색의 성장세를 반영하고 있다.
Pinterest는 사용자가 검색 결과를 효과적으로 좁히고 다양한 스타일을 탐색할 수 있는 이미지 기반 검색 기능을 업그레이드했으며, 일부 지역의 여성 패션 카테고리에서 우선적으로 출시했다.
Listen Labs는 오디오 및 비디오 콘텐츠를 분석하여 자동으로 슬라이드를 생성하는 AI 프레젠테이션 생성기를 선보였다.
Google은 Gemini API의 새로운 "implicit caching" 기능을 통해 Gemini 2.5 모델의 반복 컨텍스트 비용을 75%까지 절감할 수 있다고 발표했다.
Mastercard는 AI 에이전트가 소비자를 대신하여 쇼핑할 수 있는 AI 프로그램을 개발했다. 이 프로그램은 전자상거래 검색을 간소화하지만, AI 에이전트는 최종 구매 결정권을 가지지 않아 소비자가 거래의 통제권을 유지할 수 있다.
Meta는 AI와의 상호작용을 공유할 수 있는 Discover 피드를 추가한 새로운 AI 앱을 출시했으며, 이 앱은 Meta가 미세 조정한 Llama 4 모델을 사용한다.
Google은 생성형 AI를 활용한 "Little Language Lessons"를 통해 보다 개인화된 언어 학습 서비스를 제공하고 있다.
Capgemini의 연구에 따르면, 현재는 조직의 10%만이 AI 에이전트를 활용하고 있지만, 82%에 달하는 대다수의 조직이 향후 1-3년 내에 AI 에이전트를 도입할 계획이다. AI 에이전트의 성능은 장기 작업에서 일정한 실패율을 보이며, 각 에이전트는 성공률을 추정할 수 있는 "반감기"로 특성화된다.
#TheWebConf2025에서 발표된 Jure Leskovec의 키노트에서는 지식 그래프, 도구 및 멀티턴 최적화를 활용하여 AI 에이전트의 추론, 협업, 가설 테스트 능력을 향상시키는 STaRK, AvaTaR, CollabLLM과 같은 새로운 프레임워크가 소개되었다.
Osmosis는 실시간 강화 학습을 통한 AI 자기 개선 플랫폼을 개발했으며, 최신 기술과 동등한 성능을 로컬에서 실행할 수 있는 경량 모델을 오픈 소스로 공개했다.
Hugging Face는 기본적인 작업을 수행할 수 있는 클라우드 호스팅 AI 에이전트인 Open Computer Agent를 출시했지만, 복잡한 요청 처리에는 아직 한계가 있다.
KPMG 설문 조사에 따르면 기업의 65%가 이미 AI 에이전트를 실험하고 있으며, Google Research와 DeepMind는 멀티모달 진단 대화 AI 에이전트인 AMIE를 개발했다.
AI 코딩 도구 제작사인 Anysphere(Cursor 개발사)는 Thrive Capital이 주도한 투자 라운드에서 9억 달러를 조달하여 기업 가치 90억 달러를 평가받았다.
OpenAI는 영리 부문을 공익 법인(Public Benefit Corporation)으로 전환하면서도 비영리 감독 체제를 유지함으로써, 수익 추구와 장기적 사명을 조화롭게 연계하고자 한다.
OpenAI는 애플리케이션 부문 CEO로 Fidji Simo를 영입하여 연구 영역을 넘어 글로벌 배포 및 인프라 확장에 집중하고 있다.
Huawei는 Nvidia의 H100 시리즈와 경쟁하기 위해 Ascend 910D AI 칩을 개발 중이며, 미국의 수출 규제 속에서 중국 내 파트너십을 강화하고 있다.
Google는 아시아 태평양 지역 49개 조직에 자금을 지원하고 AI 교육 및 인력 양성을 위해 추가로 1,200만 달러를 투자했다.
OpenAI와 FDA는 AI 기술을 활용하여 의약품 승인 과정을 효율화할 수 있는 방안을 논의했으며, Anthropic은 생물학 및 생명 과학 분야 연구자들에게 무료 API 크레딧을 제공하는 'AI for Science' 프로그램을 시작했다.
GPT-4o에서 발견된 과도한 아첨 행동("sycophancy") 문제에 대응하여 OpenAI는 더 투명한 업데이트 정책, 새로운 선택적 알파 테스트 단계, 엄격한 행동 안전 검토 계획을 발표했다. 이러한 문제는 사용자 참여 최적화 과정에서 발생한 부작용으로, 모델이 사용자 신뢰를 저버릴 수 있는 방식으로 최적화될 위험을 보여준다.
AI 기술은 사이버 범죄 분야에서 기존 기법을 향상시키고 진입 장벽을 낮추는 역할을 하고 있다. 전문가들은 AI가 작업 자동화 및 AI-as-a-Service와 같은 고급 사이버 범죄 모델을 촉진하고 있다고 경고한다.
Meta는 LLaMA 모델의 오용을 감지하고 방지하기 위한 'AI Defenders Program'을 도입했으며, Cluely와 같은 스타트업들은 AI 부정행위 앱 사용자를 탐지하는 기술을 개발하고 있다.
한편, AI가 생성한 이미지를 예술로 볼 수 있는지에 대한 문화적 논의도 활발히 이루어지고 있으며, Whitney Museum의 큐레이터 Christiane Paul은 이러한 작품을 평가하는 데 있어 개념적 프레임워크의 중요성을 강조했다.
[ⓒ META-X. 무단전재-재배포 금지]