로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

D6503

소식 LG, EXAONE Deep 공개

  • D6503
  • 조회 수 478
  • 2025.03.19. 10:31

AI가 사람의 지시 없이 스스로 가설을 세우고 검증하며, 자율적으로 의사결정을 내리는 Agentic AI 시대가 다가오고 있습니다. Agentic AI 시대로의 전환에서 추론 강화 모델의 개발은 필수적이지만 높은 성능의 추론 강화 모델을 확보하는 것이 쉬운 일은 아닙니다. 세계적으로도 파운데이션 모델을 보유한 몇몇 기업만이 자체 추론 강화 모델을 개발하고 있습니다. 

LG AI연구원은 이들 모델과 경쟁 가능한 수준을 갖춘 강력한 Reasoning AI, EXAONE Deep을 공개합니다. EXAONE Deep은 수학적 논리를 이해하고, 과학적 개념을 추론하며, 프로그래밍 문제를 해결하는 능력을 갖춘 고성능 추론 특화 모델입니다.

우리는 EXAONE Deep을 개발하는 과정에서 Math, Science, Coding 영역에서 Reasoning 성능을 비약적으로 향상시키는 데 초점을 맞추었습니다. 동시에 전반적인 영역에서 필요한 지식을 이해하고 응용할 수 있는 능력도 갖추도록 했습니다.

 

 

  1. Math – EXAONE Deep 32B, 경쟁 모델 5% 사이즈로 고난이도 수학 벤치마크에서 성능 앞서 

  2. Science & Coding – EXAONE Deep 7.8B & 2.4B, 주요 벤치마크 모두 1위하며 압도적 성능 우위  

  3. MMLU  – EXAONE Deep 32B, MMLU 83.0점으로 국내 자체 모델 중 최고 성능 입증 

 

EXAONE Deep 32B 모델은 공개 직후 미국 비영리 연구 기관인 Epoch AI의 Notable AI Models 리스트에 등재되며 성능을 입증했습니다. 이는 EXAONE 3.5 이후 연이어 등재된 것으로, 최근 2년간 해당 리스트에 등재된 대한민국 모델은 EXAONE이 유일합니다. 우리는 EXAONE Deep과 함께 단순히 숫자로 나타나는 성능을 넘어, Reasoning AI의 새로운 기준을 제시하고자 합니다.

 

이미지 1. Epoch AI의 Notable AI Models 리스트에 등재된 EXAONE Deep 과 EXAONE 3.5
(출처 : Epoch AI)

 

지금부터 EXAONE Deep의 핵심 특징과 성능을 실제 벤치마크 결과와 함께 보여드리겠습니다. 더 강력해진 EXAONE Deep과 함께 AI의 미래와 가능성을 직접 확인해 보세요!

 

EXAONE Deep Model:

https://huggingface.co/collections/LGAI-EXAONE/exaone-deep-67d119918816ec6efa79a4aa

https://github.com/LG-AI-EXAONE/EXAONE-Deep

 

EXAONE Deep Technical Report:

https://arxiv.org/abs/2503.12524

 

1. Math ━ 2025학년도 수능 수학 영역 최고점 기록, 7.8B&2.4B 주요 벤치마크 모두 1위 

EXAONE Deep 32B, 7.4B, 2.4B 모델 모두 2025학년도 수능 수학 영역에서 글로벌 추론 모델 대비 월등한 성능을 입증했습니다. 동급 모델과 비교했을 때 모두 최고 점수를 기록하며 수학적 추론 능력에서 압도적인 경쟁력을 보여주었습니다.

 

이미지 2. Performance Comparison in the Mathematics Category
※ 별표(*)는 공식적으로 보고된 수치를, 보라색으로 강조된 점수는 최고 성능을 나타냅니다. 

 

이미지 3. CSAT 2025 Mathematics Evaluation Results

 

 

EXAONE Deep 32B ━ 경쟁 모델의 5% 사이즈로 고난이도 수학 벤치마크 성능 앞서

EXAONE Deep 32B 모델은 수능 수학 영역에서 94.5점, 미국 올림피아드 선발 초청 기준으로 활용되는 AIME 2024에서 90.0점을 기록하며 경쟁 모델 중 최고 성능을 보였습니다.
AIME 2025에서는 DeepSeek-R1(671B) 모델과 동등한 성과를 달성했습니다.
이 결과는 까다로운 수학 평가에서 뛰어난 문제 해결 능력과 논리적 추론력을 입증했음을 의미합니다. 
특히, AIME처럼 난이도가 높은 평가에서 큰 사이즈의 모델들 대비 우수한 점수를 기록하여 EXAONE의 주요 강점으로 손꼽히는 학습 효율성과 경제성을 다시 한번 확인할 수 있었습니다. 
 

EXAONE Deep 7.8B & 2.4B ━ 주요 벤치마크에서 모두 1위 달성

7.8B와 2.4B 모델은 각각 경량 모델과 온디바이스 모델 군에서 주요 벤치마크 모두 1위를 기록하며 압도적인 성능을 입증했습니다. 7.8B 모델은 MATH-500에서 94.8점, AIME 2025에서 59.6점을 기록했고 2.4B 모델은 각각 92.3점과 47.9점을 나타냈습니다.

 

2. Science & Coding ━ 전문 과학 분야 추론 및 소프트웨어 코딩 능력 탁월 

 

이미지 4. Performance Comparison in the Coding Category
※ 별표(*)는 공식적으로 보고된 수치를, 보라색으로 강조된 점수는 최고 성능을 나타냅니다. 

 

EXAONE Deep 모델은 과학과 코딩 영역에서도 압도적인 성능을 입증했습니다. 

먼저 32B 모델은 박사 수준의 물리학, 화학, 생물학 분야 문제 해결 능력을 평가하는 GPQA 다이아몬드(Diamond) 테스트에서 66.1점, 코딩 능력을 평가하는 라이브코드벤치(LiveCodeBench)는 59.5점을 기록했습니다. 전문 지식이 필요한 영역에서도 높은 활용도를 갖췄음을 시사합니다. 

7.8B와 2.4B 모델 역시 GPQA 다이아몬드와 라이브코드벤치 모두에서 1위를 기록했습니다. 특히 작년 12월 공개한 EXAONE 3.5 2.4B 모델이 Hugging Face의 'LLM 리더보드' 엣지부문 1위에 오른 데 이어, EXAONE Deep이 최고 성능을 달성함으로써 글로벌 최고 수준의 경량 및 온디바이스용 모델임을 입증했습니다. 

 

3. MMLU ━ 국내 자체 모델 중 최고 성능 입증 

EXAONE Deep 모델은 수학, 과학, 코딩 분야에 특화된 추론 성능과 함께, General 영역에서의 성능도 한층 강화됐습니다. 특히 32B 모델은 MMLU(Massive Multitask Language Understanding)에서 83.0 점을 기록하여, 국내 자체 모델 중 단연 최고 수준의 성능을 달성했습니다.  

 

이미지 5. Performance Comparison in the General Category 
※ 별표(*)는 공식적으로 보고된 수치를, 보라색으로 강조된 점수는 최고 성능을 나타냅니다. 

 

EXAONE Deep은 수학, 과학과 코딩 등 다양한 영역에서 AI의 추론 능력을 확장하고, 이를 넘어 더욱 복잡한 문제 해결에 도전하고 있습니다. 앞으로도 지속적인 연구와 혁신을 통해, AI가 인류의 삶을 더 풍요롭고 편리하게 만드는 데 기여할 수 있도록 발전해 나가겠습니다.

D6503
미니기기
삼성 Galaxy Z Fold5 / 삼성 Galaxy Note10
(퇴역) Sony XPERIA 1 / 삼성 Galaxy Note FE / Sony XPERIA XZ Premium / Sony XPERIA Z2

삼성 Galaxy Tab S9 Ultra

삼성 Galaxy Watch6 Classic

Lenovo Thinkpad T14s Gen4 AMD

음향
Sony NW-A100TPS
AKG N5005
댓글
0
취소
번호 분류 제목 글쓴이 조회 수 날짜
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 9 71500 19.11.15
핫글 소식 '혐한' 의혹 휘말린 MS-베다스다…한국 게이머 패싱 언제까지 new 뉴스봇 4 262 11:01
핫글 소식 MS, 코파일럿 플러스 PC 대상 Recall 및 Click to Do 기능 출시 [1] file FHS17 1 336 01:18
68772 소식 삼성, 2025년 상반기 삼성직무적성검사 실시 new 뉴스봇 0 20 16:00
68771 소식 삼성전자 ‘AI 가전 트로이카’ 캠페인으로 가전 3대장 리더십 강화 new 뉴스봇 0 65 14:00
68770 소식 AMD, 젠5 CPU 보안 취약점 '엔트리사인' 업데이트 공개 new 뉴스봇 0 153 11:01
68769 소식 '혐한' 의혹 휘말린 MS-베다스다…한국 게이머 패싱 언제까지 new 뉴스봇 4 262 11:01
68768 소식 LG디스플레이, 업계 최초 TUV 라인란드 '제품 탄소발자국 방법론' 인증 획득 new 뉴스봇 0 105 11:01
68767 소식 KT 지니 TV, 가정의 달 맞아 애니메이션 13편 무료 공개 new 뉴스봇 0 89 10:15
68766 소식 LG유플러스, '키즈토피아' 한국 생태·문화 체험형 콘텐츠 선봬 new 뉴스봇 0 86 09:00
68765 소식 MS, 코파일럿 플러스 PC 대상 Recall 및 Click to Do 기능 출시 [1] file FHS17 1 336 01:18
68764 소식 KUXIU, 세계 최초의 준고체 전해질 보조배터리 S1/S2 발표 file Stellist 3 348 25.04.26
68763 소식 "AI, 스스로 보호하려 들 수 있다"…앤트로픽, '모델 복지' 기준 실험 착수 뉴스봇 1 347 25.04.26
68762 소식 “한톨의 희토류라도 챙겨라” 새로운 광산이 된 구형 서버 뉴스봇 0 280 25.04.26
68761 소식 노트북에 USB-C 포트를 하나 더 추가해야 하는 이유 뉴스봇 0 369 25.04.26
68760 소식 284만원짜리 폴더블 아이폰…페이스ID는 가능할까 뉴스봇 1 333 25.04.26
68759 소식 애플, iOS19에 삼성 덱스 닮은 기능 탑재? BarryWhite 2 605 25.04.26
68758 소식 "애플, 내년까지 미국 판매 아이폰 생산 기지 인도로 옮긴다" 뉴스봇 1 361 25.04.26
68757 소식 아디다스, 3D 프린팅으로 만든 신발 5월 2일 글로벌 출시 [1] update 뉴스봇 0 262 25.04.26
68756 소식 북한 해커들, 美에 유령 회사 설립…암호화폐 개발자 겨냥 뉴스봇 0 192 25.04.26
68755 소식 구글, 유튜브에도 AI 오버뷰 테스트...영상 핵심 장면만 자동 편집 뉴스봇 0 212 25.04.26
68754 소식 B&W, ANC 무선헤드폰 Px7 S3 발표 [1] file Stellist 1 307 25.04.26
68753 소식 "허탕쳤다" 벌써 품절 대란?…"무조건 교체 말고" 지침엔 [8] file 미붕붕드링크 6 1141 25.04.26
68752 소식 루머 : 삼성 캐나다에서 갤럭시S25 엣지 가격 유출 [1] file Stellist 3 715 25.04.25
68751 소식 "수익에 광고효과까지'…방송사-OTT '합종연횡' 가속화 뉴스봇 0 235 25.04.25
68750 소식 한국판 엔비디아 '쿠다' 마련한다…과기정통부, 시스템 SW 생태계 활성화 '박차' [3] 뉴스봇 1 699 25.04.25
68749 소식 2025년형 삼성 OLED TV, 글로벌 테크 미디어로부터 호평 이어져 뉴스봇 0 233 25.04.25
68748 소식 "아이폰17 에어·아이폰17 프로, 12GB 램 탑재" 뉴스봇 0 308 25.04.25
68747 소식 인텔 "美·中 상호 관세에 타격 우려"... 2분기 매출 전망치 하향 뉴스봇 0 100 25.04.25
68746 소식 인텔 립부 탄 CEO, 4월부터 추가 구조조정 예고 뉴스봇 0 130 25.04.25
68745 소식 ‘이 기능’ 끄면 6GB 확보…iOS 18을 쾌적하게 만드는 설정 7가지 뉴스봇 3 825 25.04.25
68744 소식 SKT "해킹 원인·피해 규모는 정부 조사 후 직접 설명“ 뉴스봇 1 364 25.04.25
68743 소식 삼성디스플레이, BOE 상대 美특허소송 파상 공세 [2] 뉴스봇 4 501 25.04.25
68742 소식 SKT, 해킹 사고 수습 총력...28일부터 유심 무료 교체 서비스 뉴스봇 1 332 25.04.25
68741 소식 AI 시대에도 구글 검색·광고 건재 과시...광고 매출 예상치 상회 뉴스봇 0 71 25.04.25
68740 소식 넷플릭스, 대사만 표시하는 자막 도입…자연스러운 몰입감 유도 뉴스봇 0 237 25.04.25
68739 소식 백악관, AI 개발 계획에 1만건 넘는 의견 수렴…오픈AI·구글도 참여 뉴스봇 0 107 25.04.25
68738 소식 네이버 지도 앱에서 전국 1200여개 공공시설 예약 가능 뉴스봇 0 167 25.04.25

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.