구글딥마인드 'SIMA 2' 공개...“명령 따르는 AI를 넘어서”
X 기자
metax@metax.kr | 2025-11-20 07:00:00
구글 딥마인드가 3D 게임 속에서 사람처럼 보고, 움직이고, 배우는 AI 에이전트의 두 번째 버전 ‘SIMA 2(Scalable Instructable Multiworld Agent 2)’를 공개했다.
이번 버전은 단순히 “좌회전해”, “사다리 올라가” 같은 명령을 따라 하는 수준을 넘어, 목표를 이해하고, 스스로 계획을 세우며, 시간이 지나면서 자기 능력을 개선하는 ‘게임 동료형 AI’로 진화했다는 점에서 주목된다.
딥마인드는 SIMA 2를 가리켜 “일반 인공지능(AGI)을 향한 중요한 진전이며, 향후 로봇과 물리 세계로 확장될 ‘체화된 지능(embodied intelligence)’의 핵심 시험대”라고 설명한다.
SIMA 1에서 SIMA 2로: “보고, 듣고, 조작하는 AI의 두 번째 단계”
SIMA의 첫 번째 버전은 600개가 넘는 기본 동작을 여러 상업용 게임에서 수행할 수 있는 범용 언어-행동 에이전트였다.
당시 SIMA 1은 게임 코드나 내부 API에 접근하지 않고, 사람과 똑같이 화면을 ‘눈’처럼 보고, 가상 키보드·마우스를 ‘손’처럼 사용하면서, “지도 열어”, “사다리 올라가”와 같은 문장을 행동으로 바꾸는 데 집중했다.
SIMA 2는 여기서 한 단계 더 나아간다. 이번에는 에이전트의 중심에 구글의 Gemini 모델을 통합해, 단순한 지시 수행이 아니라 “왜 이 행동을 해야 하는지, 목표를 위해 어떤 순서로 움직여야 하는지”를 스스로 추론하는 구조로 설계했다.
[ⓒ META-X. 무단전재-재배포 금지]