LG ‘EXAONE Deep’ 공개..."Reasoning AI 시대"
X 기자
metax@metax.kr | 2025-03-22 12:16:48
수학·과학·코딩 특화한 EXAONE Deep
글로벌 추론 모델들과 어깨 나란히
2025년 3월 18일, LG AI연구원이 고성능 추론 특화 AI 모델 ‘EXAONE Deep’을 공식 공개했다.
이 모델은 수학적 사고, 과학 개념 이해, 프로그래밍 문제 해결 능력을 갖춘 Reasoning 특화 AI 모델로, 최근 세계적으로 주목받고 있는 ‘Agentic AI’ 시대를 겨냥한 기술적 진화를 담고 있다.
EXAONE Deep은 공개 직후 미국 AI 리서치 기관 Epoch AI의 Notable AI Models 리스트에 등재되며 기술력을 인정받았다. 이는 EXAONE 3.5에 이어 대한민국 모델 중 유일한 2회 연속 등재 사례다.

/LG AI연구원
추론 중심의 AI, Agentic 시대로의 진입
EXAONE Deep은 단순 언어 처리 기능을 넘어서, ‘스스로 생각하고 문제를 해결하는 AI’로의 도약을 목표로 설계됐다. 이는 최근 AI 산업에서 주목받는 Agentic AI (자율적 판단 기반의 인공지능) 트렌드와 맞닿아 있다.
EXAONE Deep은 수학, 과학, 코딩이라는 복잡한 추론이 필요한 영역을 집중적으로 학습했으며, 기존 GPT 계열 모델들이 강점을 보이던 범용 언어처리보다는 논리적 추론 및 해석 능력에 초점을 맞춘 것이 특징이다.
글로벌 AI 시장은 OpenAI, Google DeepMind, Anthropic, Mistral 등 소수 빅테크 기업이 초거대 파운데이션 모델을 독점하는 구조로 재편되고 있다.
이런 흐름 속에서 LG는 자체 연구로 EXAONE Deep을 개발해 모델 주권 확보와 함께 글로벌 수학·과학 AI 시장 공략을 시도하고 있다.
특히 EXAONE Deep 32B는 경쟁 모델 대비 5% 수준의 사이즈로 유사한 성능을 달성함으로써, 운영 효율성과 경제성 측면에서도 강점을 드러냈다.
대학입시, 연구 설계, 소프트웨어 개발, 공공문서 작성 등 고차원적 Reasoning 능력이 요구되는 실사용 영역에서, 단순 언어 생성 AI보다 뛰어난 성능을 요구하는 목소리가 커지고 있다.
EXAONE Deep은 이 수요에 대응하며, 지식 산업 중심의 AI 활용 전환을 이끄는 사례로 해석된다.
성능 분석: 주요 벤치마크별 정량 평가
수학 (Math)
2025학년도 수능 수학영역: EXAONE Deep 32B 모델이 94.5점으로 최고 성능 AIME 2024: 90.0점, AIME 2025에서는 DeepSeek-R1(671B)과 동급 성과 MATH-500 (7.8B): 94.8점 MATH-500 (2.4B): 92.3점※ EXAONE Deep 7.8B, 2.4B 모델은 소형·온디바이스 영역에서 전 세계 벤치마크 1위

과학·코딩 (Science & Coding)
GPQA Diamond (박사급 과학 문제): EXAONE Deep 32B – 66.1점 LiveCodeBench (코딩 테스트): EXAONE Deep 32B – 59.5점 7.8B / 2.4B 모델 역시 각 벤치마크에서 최고 성능 기록
종합 언어 이해 (MMLU)
EXAONE Deep 32B: 83.0점 대한민국 자체 개발 모델 중 역대 최고 성능 기록
대한민국 AI 기술의 글로벌 위상 강화
Epoch AI는 AI 연구 기관의 성능 기준을 공식화한 글로벌 기관으로, EXAONE Deep의 등재는 단순한 마케팅이 아닌 글로벌 기술 평가의 객관적 지표로 해석된다.
이는 대한민국이 데이터 주권과 모델 주권을 확보할 수 있는 기반을 마련했음을 상징하며, 향후 아시아권 AI 기술 확산의 교두보 역할을 할 수 있다.
Reasoning 특화 vs 범용 LLM 전략
OpenAI의 GPT-4, Google의 Gemini 등은 범용성과 확장성에 초점을 맞추고 있는 반면, EXAONE Deep은 특정 분야의 깊이 있는 문제 해결 능력을 강화하고 있다.
이러한 접근은 특정 산업(예: 교육, R&D, 소프트웨어 개발)에서 차별화된 성능을 요구하는 사용자층을 확보하는 전략으로 볼 수 있다.
글로벌 사례 비교 (Academic & Case Studies)
Reasoning AI, 산업별 특화모델 시장 주도할 가능성
AI가 인간의 명령 없이 스스로 문제를 정의하고, 해결책을 탐색하며, 결과를 내는 'Agentic AI' 시대가 도래함에 따라, 단순 언어모델보다 문제 해결 중심의 Reasoning 모델이 산업 현장에서 더욱 각광받게 될 전망이다. 이는 특히 교육, 의료, 연구, 법률, 공공정책 등 전문성과 고도화된 추론이 필요한 영역에서 빠르게 도입될 가능성이 높다.
LG의 EXAONE Deep 사례는, 한국 기업도 자체 기술력으로 고성능 AI 모델을 개발하고 글로벌 기준에 도달할 수 있음을 입증했다.
향후 공공 AI 서비스, 국방·행정용 AI, 교육 시스템, 온디바이스 AI 솔루션 등으로 확장될 경우, AI 모델의 수입 소비국에서 수출 산업으로의 전환 가능성도 기대된다.
EXAONE Deep은 단순히 ‘국내 AI 모델’이라는 의미를 넘어, 고성능 추론 AI 시장에서 대한민국이 기술 독립성과 글로벌 경쟁력을 확보할 수 있음을 보여준 상징적 성과다.
수학, 과학, 코딩 등 복잡한 문제 해결에 특화된 이 모델은, 범용 AI와는 또 다른 방향의 가능성을 제시하며, Agentic AI 시대의 실질적 기준으로 자리잡을 준비를 마쳤다.
[ⓒ META-X. 무단전재-재배포 금지]