로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

D6503

소식 LG, EXAONE Deep 공개

  • D6503
  • 조회 수 478
  • 2025.03.19. 10:31

AI가 사람의 지시 없이 스스로 가설을 세우고 검증하며, 자율적으로 의사결정을 내리는 Agentic AI 시대가 다가오고 있습니다. Agentic AI 시대로의 전환에서 추론 강화 모델의 개발은 필수적이지만 높은 성능의 추론 강화 모델을 확보하는 것이 쉬운 일은 아닙니다. 세계적으로도 파운데이션 모델을 보유한 몇몇 기업만이 자체 추론 강화 모델을 개발하고 있습니다. 

LG AI연구원은 이들 모델과 경쟁 가능한 수준을 갖춘 강력한 Reasoning AI, EXAONE Deep을 공개합니다. EXAONE Deep은 수학적 논리를 이해하고, 과학적 개념을 추론하며, 프로그래밍 문제를 해결하는 능력을 갖춘 고성능 추론 특화 모델입니다.

우리는 EXAONE Deep을 개발하는 과정에서 Math, Science, Coding 영역에서 Reasoning 성능을 비약적으로 향상시키는 데 초점을 맞추었습니다. 동시에 전반적인 영역에서 필요한 지식을 이해하고 응용할 수 있는 능력도 갖추도록 했습니다.

 

 

  1. Math – EXAONE Deep 32B, 경쟁 모델 5% 사이즈로 고난이도 수학 벤치마크에서 성능 앞서 

  2. Science & Coding – EXAONE Deep 7.8B & 2.4B, 주요 벤치마크 모두 1위하며 압도적 성능 우위  

  3. MMLU  – EXAONE Deep 32B, MMLU 83.0점으로 국내 자체 모델 중 최고 성능 입증 

 

EXAONE Deep 32B 모델은 공개 직후 미국 비영리 연구 기관인 Epoch AI의 Notable AI Models 리스트에 등재되며 성능을 입증했습니다. 이는 EXAONE 3.5 이후 연이어 등재된 것으로, 최근 2년간 해당 리스트에 등재된 대한민국 모델은 EXAONE이 유일합니다. 우리는 EXAONE Deep과 함께 단순히 숫자로 나타나는 성능을 넘어, Reasoning AI의 새로운 기준을 제시하고자 합니다.

 

이미지 1. Epoch AI의 Notable AI Models 리스트에 등재된 EXAONE Deep 과 EXAONE 3.5
(출처 : Epoch AI)

 

지금부터 EXAONE Deep의 핵심 특징과 성능을 실제 벤치마크 결과와 함께 보여드리겠습니다. 더 강력해진 EXAONE Deep과 함께 AI의 미래와 가능성을 직접 확인해 보세요!

 

EXAONE Deep Model:

https://huggingface.co/collections/LGAI-EXAONE/exaone-deep-67d119918816ec6efa79a4aa

https://github.com/LG-AI-EXAONE/EXAONE-Deep

 

EXAONE Deep Technical Report:

https://arxiv.org/abs/2503.12524

 

1. Math ━ 2025학년도 수능 수학 영역 최고점 기록, 7.8B&2.4B 주요 벤치마크 모두 1위 

EXAONE Deep 32B, 7.4B, 2.4B 모델 모두 2025학년도 수능 수학 영역에서 글로벌 추론 모델 대비 월등한 성능을 입증했습니다. 동급 모델과 비교했을 때 모두 최고 점수를 기록하며 수학적 추론 능력에서 압도적인 경쟁력을 보여주었습니다.

 

이미지 2. Performance Comparison in the Mathematics Category
※ 별표(*)는 공식적으로 보고된 수치를, 보라색으로 강조된 점수는 최고 성능을 나타냅니다. 

 

이미지 3. CSAT 2025 Mathematics Evaluation Results

 

 

EXAONE Deep 32B ━ 경쟁 모델의 5% 사이즈로 고난이도 수학 벤치마크 성능 앞서

EXAONE Deep 32B 모델은 수능 수학 영역에서 94.5점, 미국 올림피아드 선발 초청 기준으로 활용되는 AIME 2024에서 90.0점을 기록하며 경쟁 모델 중 최고 성능을 보였습니다.
AIME 2025에서는 DeepSeek-R1(671B) 모델과 동등한 성과를 달성했습니다.
이 결과는 까다로운 수학 평가에서 뛰어난 문제 해결 능력과 논리적 추론력을 입증했음을 의미합니다. 
특히, AIME처럼 난이도가 높은 평가에서 큰 사이즈의 모델들 대비 우수한 점수를 기록하여 EXAONE의 주요 강점으로 손꼽히는 학습 효율성과 경제성을 다시 한번 확인할 수 있었습니다. 
 

EXAONE Deep 7.8B & 2.4B ━ 주요 벤치마크에서 모두 1위 달성

7.8B와 2.4B 모델은 각각 경량 모델과 온디바이스 모델 군에서 주요 벤치마크 모두 1위를 기록하며 압도적인 성능을 입증했습니다. 7.8B 모델은 MATH-500에서 94.8점, AIME 2025에서 59.6점을 기록했고 2.4B 모델은 각각 92.3점과 47.9점을 나타냈습니다.

 

2. Science & Coding ━ 전문 과학 분야 추론 및 소프트웨어 코딩 능력 탁월 

 

이미지 4. Performance Comparison in the Coding Category
※ 별표(*)는 공식적으로 보고된 수치를, 보라색으로 강조된 점수는 최고 성능을 나타냅니다. 

 

EXAONE Deep 모델은 과학과 코딩 영역에서도 압도적인 성능을 입증했습니다. 

먼저 32B 모델은 박사 수준의 물리학, 화학, 생물학 분야 문제 해결 능력을 평가하는 GPQA 다이아몬드(Diamond) 테스트에서 66.1점, 코딩 능력을 평가하는 라이브코드벤치(LiveCodeBench)는 59.5점을 기록했습니다. 전문 지식이 필요한 영역에서도 높은 활용도를 갖췄음을 시사합니다. 

7.8B와 2.4B 모델 역시 GPQA 다이아몬드와 라이브코드벤치 모두에서 1위를 기록했습니다. 특히 작년 12월 공개한 EXAONE 3.5 2.4B 모델이 Hugging Face의 'LLM 리더보드' 엣지부문 1위에 오른 데 이어, EXAONE Deep이 최고 성능을 달성함으로써 글로벌 최고 수준의 경량 및 온디바이스용 모델임을 입증했습니다. 

 

3. MMLU ━ 국내 자체 모델 중 최고 성능 입증 

EXAONE Deep 모델은 수학, 과학, 코딩 분야에 특화된 추론 성능과 함께, General 영역에서의 성능도 한층 강화됐습니다. 특히 32B 모델은 MMLU(Massive Multitask Language Understanding)에서 83.0 점을 기록하여, 국내 자체 모델 중 단연 최고 수준의 성능을 달성했습니다.  

 

이미지 5. Performance Comparison in the General Category 
※ 별표(*)는 공식적으로 보고된 수치를, 보라색으로 강조된 점수는 최고 성능을 나타냅니다. 

 

EXAONE Deep은 수학, 과학과 코딩 등 다양한 영역에서 AI의 추론 능력을 확장하고, 이를 넘어 더욱 복잡한 문제 해결에 도전하고 있습니다. 앞으로도 지속적인 연구와 혁신을 통해, AI가 인류의 삶을 더 풍요롭고 편리하게 만드는 데 기여할 수 있도록 발전해 나가겠습니다.

D6503
미니기기
삼성 Galaxy Z Fold5 / 삼성 Galaxy Note10
(퇴역) Sony XPERIA 1 / 삼성 Galaxy Note FE / Sony XPERIA XZ Premium / Sony XPERIA Z2

삼성 Galaxy Tab S9 Ultra

삼성 Galaxy Watch6 Classic

Lenovo Thinkpad T14s Gen4 AMD

음향
Sony NW-A100TPS
AKG N5005
댓글
0
취소
번호 분류 제목 글쓴이 조회 수 날짜
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 9 71466 19.11.15
핫글 소식 애플, iOS19에 삼성 덱스 닮은 기능 탑재? BarryWhite 2 510 25.04.26
핫글 소식 KUXIU, 세계 최초의 준고체 전해질 보조배터리 S1/S2 발표 newfile Stellist 2 216 25.04.26
핫글 소식 284만원짜리 폴더블 아이폰…페이스ID는 가능할까 new 뉴스봇 1 190 25.04.26
68765 소식 MS, 코파일럿 플러스 PC 대상 Recall 및 Click to Do 기능 출시 [1] newfile FHS17 0 120 01:18
68764 소식 KUXIU, 세계 최초의 준고체 전해질 보조배터리 S1/S2 발표 newfile Stellist 2 216 25.04.26
68763 소식 "AI, 스스로 보호하려 들 수 있다"…앤트로픽, '모델 복지' 기준 실험 착수 new 뉴스봇 1 200 25.04.26
68762 소식 “한톨의 희토류라도 챙겨라” 새로운 광산이 된 구형 서버 new 뉴스봇 0 183 25.04.26
68761 소식 노트북에 USB-C 포트를 하나 더 추가해야 하는 이유 new 뉴스봇 0 238 25.04.26
68760 소식 284만원짜리 폴더블 아이폰…페이스ID는 가능할까 new 뉴스봇 1 190 25.04.26
68759 소식 애플, iOS19에 삼성 덱스 닮은 기능 탑재? BarryWhite 2 510 25.04.26
68758 소식 "애플, 내년까지 미국 판매 아이폰 생산 기지 인도로 옮긴다" 뉴스봇 1 323 25.04.26
68757 소식 아디다스, 3D 프린팅으로 만든 신발 5월 2일 글로벌 출시 뉴스봇 0 224 25.04.26
68756 소식 북한 해커들, 美에 유령 회사 설립…암호화폐 개발자 겨냥 뉴스봇 0 160 25.04.26
68755 소식 구글, 유튜브에도 AI 오버뷰 테스트...영상 핵심 장면만 자동 편집 뉴스봇 0 177 25.04.26
68754 소식 B&W, ANC 무선헤드폰 Px7 S3 발표 [1] file Stellist 1 275 25.04.26
68753 소식 "허탕쳤다" 벌써 품절 대란?…"무조건 교체 말고" 지침엔 [8] file 미붕붕드링크 6 1063 25.04.26
68752 소식 루머 : 삼성 캐나다에서 갤럭시S25 엣지 가격 유출 [1] file Stellist 3 688 25.04.25
68751 소식 "수익에 광고효과까지'…방송사-OTT '합종연횡' 가속화 뉴스봇 0 222 25.04.25
68750 소식 한국판 엔비디아 '쿠다' 마련한다…과기정통부, 시스템 SW 생태계 활성화 '박차' [3] 뉴스봇 1 670 25.04.25
68749 소식 2025년형 삼성 OLED TV, 글로벌 테크 미디어로부터 호평 이어져 뉴스봇 0 221 25.04.25
68748 소식 "아이폰17 에어·아이폰17 프로, 12GB 램 탑재" 뉴스봇 0 295 25.04.25
68747 소식 인텔 "美·中 상호 관세에 타격 우려"... 2분기 매출 전망치 하향 뉴스봇 0 96 25.04.25
68746 소식 인텔 립부 탄 CEO, 4월부터 추가 구조조정 예고 뉴스봇 0 124 25.04.25
68745 소식 ‘이 기능’ 끄면 6GB 확보…iOS 18을 쾌적하게 만드는 설정 7가지 뉴스봇 3 798 25.04.25
68744 소식 SKT "해킹 원인·피해 규모는 정부 조사 후 직접 설명“ 뉴스봇 1 355 25.04.25
68743 소식 삼성디스플레이, BOE 상대 美특허소송 파상 공세 [2] 뉴스봇 3 488 25.04.25
68742 소식 SKT, 해킹 사고 수습 총력...28일부터 유심 무료 교체 서비스 뉴스봇 1 319 25.04.25
68741 소식 AI 시대에도 구글 검색·광고 건재 과시...광고 매출 예상치 상회 뉴스봇 0 65 25.04.25
68740 소식 넷플릭스, 대사만 표시하는 자막 도입…자연스러운 몰입감 유도 뉴스봇 0 221 25.04.25
68739 소식 백악관, AI 개발 계획에 1만건 넘는 의견 수렴…오픈AI·구글도 참여 뉴스봇 0 99 25.04.25
68738 소식 네이버 지도 앱에서 전국 1200여개 공공시설 예약 가능 뉴스봇 0 150 25.04.25
68737 소식 SK하이닉스, HBM4 공개로 넥스트 AI 메모리 시장 선점 뉴스봇 0 131 25.04.25
68736 소식 애플 아이폰16e, 자체 모뎀 탑재로 3100억원 절감 효과 뉴스봇 0 254 25.04.25
68735 소식 아이폰17, 12GB 램 탑재 가능성…에어 모델도 프로급 성능? 뉴스봇 0 151 25.04.25
68734 소식 iOS 19 멀티태스킹 강화… 아이폰 폴드 위한 큰 그림일까 뉴스봇 0 243 25.04.25
68733 소식 메타, 리얼리티 랩스 부문 감원…VR·AR 투자 전략 변화하나 뉴스봇 0 104 25.04.25
68732 소식 4133억 실탄 확보하는 SKT, 카카오 지분 전량 매각 [1] 뉴스봇 0 301 25.04.25
68731 소식 KT스카이라이프, 전국생활체육대축전 'AI'로 실시간 중계 뉴스봇 0 87 25.04.25

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.