[2025년 17째주] MetaX 주간 AI 동향 리포트

김한얼 기자

loenahmik@gmail.com | 2025-04-26 11:55:13

Gemini 2.5 Flash, Grok Vision 등 모델 고도화…AI 에이전트 현실화와 산업별 혁신 가속화
AI 안전 고도화와 인프라 경쟁 본격화… 웹·로봇·개발 생산성까지 확장되는 실전 응용

이번 주 글로벌 인공지능(AI) 산업계에서는 모델 성능의 획기적인 고도화와 함께 활용 분야의 급속한 확장이 이루어지고 있다. 이미지 생성 API의 개방, 멀티모달 기능의 강화, 산업별 맞춤형 AI의 부상은 이러한 변화를 대표한다. 동시에 AI 안전성과 윤리적 책임에 대한 논의도 활발히 전개되고 있으며, 컴퓨팅 인프라 확충과 개발 생산성 도구 경쟁도 치열해지고 있다. 웹 생태계 변화 조짐, 창의 콘텐츠 제작, 로봇 기술 확산 등 새로운 응용 분야의 진입 또한 눈에 띈다.

혁신적 지능 모델의 가시적 도약

Google은 최신 경량 모델인 Gemini 2.5 Flash를 출시하며 전작 대비 성능을 대폭 향상시켰다. 해당 모델은 주요 STEM 벤치마크에서 Anthropic의 Claude와 유사한 성능을 입증했다. OpenAI는 ChatGPT의 비주얼 기능을 담당하는 이미지 생성 모델을 API 형태로 공개해, 개발자들이 이미지 생성 기능을 자사 앱 및 서비스에 손쉽게 통합할 수 있도록 했다. xAI의 Grok 챗봇은 시각적 입력을 인식하는 'Grok Vision' 기능을 iOS에 적용해, 사용자가 화면을 기반으로 자연어 질문을 할 수 있도록 지원한다. Adobe는 Firefly의 주요 업데이트를 통해 이미지, 비디오, 오디오 및 벡터 생성을 하나의 플랫폼에 통합하고, 모바일 및 Creative Cloud와의 연계를 강화했다.

그림1. Firefly (출처: Adobe) 에이전트 기반 상호작용 기술의 현실화

AI 에이전트 기술의 상용화가 빠르게 진행되고 있다. ElevenLabs는 실제에 가까운 음성 에이전트를 대규모로 배포할 수 있는 기술을 선보이며 고객 상담, 예약, 튜터링 등 다양한 업무에 활용되고 있다. Trae AI는 IDE 내에 전문 에이전트를 소환할 수 있는 @Agent 기능을 도입해, 사용자 정의 에이전트 팀을 구성하고 대화 맥락을 유지할 수 있는 환경을 구현했다. Microsoft는 365 Copilot Wave 2를 통해 OpenAI 기반 추론 에이전트가 포함된 'Agent Store'를 출시하며, 문서 작성, 분석, 정보 검색 등 다양한 업무의 AI 자동화를 제시하고 있다.

그림2. Trae IDE (출처: Trae AI) 산업 맞춤형 AI 기술의 정교화

Cohere의 최신 멀티모달 임베딩 모델인 Embed 4는 100개 이상의 언어를 지원하며, 긴 문맥을 이해하고 산업별 문서를 정밀하게 처리할 수 있다. 특히 금융, 의료, 제조 등 고규제 산업에서 활용성을 높여 전문 영역에 특화된 AI 개발을 가능하게 한다. Perplexity는 Motorola와의 협업을 통해, 새로운 휴대폰에 자사 검색형 AI를 사전 설치하고 음성 제어, 알림 관리, Moto AI 통합 기능을 지원한다. Google은 미국 내 인프라 관련 스타트업을 대상으로 한 6개월 액셀러레이터 프로그램 'Google AI Academy'를 운영하며 산업별 AI 적용 확대를 추진하고 있다.

그림3. Cohere Embed 4 (출처: Cohere) AI 안전성과 윤리적 대응의 체계화

Anthropic은 AI 유해성에 대한 다차원 평가 프레임워크를 발표하며, 파국적·일상적 위험 모두를 포괄적으로 분석하는 기준을 제시했다. 해당 프레임워크는 물리적·심리적·경제적·사회적 영향과 자율성 침해 등을 포함하여 테스트 및 정책 설계에 참고할 수 있도록 구성됐다. 또한, 모델의 도덕적 관련성과 'AI 복지' 고려 여부에 대한 새로운 연구 이니셔티브도 시작했다. OpenAI는 자사의 안전 프레임워크를 업데이트하며 고위험 기능 우선순위, 명확한 기능 분류, 확장 가능한 테스트 방식 및 안전 보고서 기준을 정립했다.

그림4. Exploring model welfare (출처: Anthropic) 개발 생산성 향상을 위한 도구 진화

JetBrains는 스마트 코딩 에이전트 Junie를 출시하여, 코드 검색, 문맥 기반 코드 작성, 테스트 실행 및 결과 공유 등의 작업을 자율적으로 지원한다. Indeed는 내부 개발 루프 최적화 및 배포 자동화를 위한 AI 기반 개발자 도구를 도입해, 반복 작업 최소화와 효율 향상에 초점을 맞추고 있다.

그림5. Junie (출처: JetBrains) 미래 컴퓨팅 인프라 구축 경쟁 심화

xAI는 대규모 AI 모델 학습을 위해 차세대 슈퍼컴퓨터 클러스터 Colossus 2를 구축 중이다. 이는 연산 자원 경쟁이 계속해서 심화되고 있음을 보여준다. 한편, Rebellions는 SK텔레콤의 Sapeon과 합병하여 에너지 효율적인 AI 전용 칩 개발을 가속화하며 Nvidia 등과의 경쟁에 대비하고 있다.

그림6. 미국 멤피스에 위치한 xAi Colossus (출처: xAi Colossus) 웹 생태계 및 비즈니스 모델 변화

OpenAI는 ChatGPT에 Shopify 결제 시스템이 통합될 가능성을 암시하는 코드 스트링이 발견되면서, 챗봇 기반 커머스 환경이 현실화될 수 있다는 기대를 모은다. 또한, OpenAI는 반독점 규제로 인해 Google이 Chrome을 매각해야 할 경우 인수에 관심이 있다고 밝혀, 검색 시장의 경쟁 구도에 대한 잠재적인 변화를 시사하고 있다.

그림7. OpenAI와 shopify AI 응용의 실세계 확장

AI의 적용은 로봇, 아바타, 감각 인식 기술 등 실세계 영역으로 빠르게 확장되고 있다. Physical Intelligence 팀은 새로운 환경에서 청소 로봇을 테스트한 결과 우수한 성능을 입증했으며, Character.AI는 AvatarFX를 통해 정지 이미지 기반의 감정 표현 동영상 생성 기능을 선보였다. 일본의 Ainos와 ugo사는 AI Nose 기술을 탑재한 휴머노이드 로봇을 통해 냄새를 인식하고 위험을 사전 감지하는 기능을 실험 중이다.

그림8. AvatarFX (출처: Character.ai)


[METAX = 김한얼 기자]

[ⓒ META-X. 무단전재-재배포 금지]

WEEKLY HOT