로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

BarryWhite

소식 AMD MI300X 벤치마크, 엔비디아 H100과 대등

AMD가 인공지능(AI) 및 고성능컴퓨팅(HPC)용 가속기 인스팅트(Instinct) MI300X의 첫 공식 MLPerf 벤치마크 결과를 공개했습니다.

 

결과적으로 MI300X 프로세서는 생성형 AI 모델 Llama 2 70B서 엔비디아 H100 GPU와 비슷한 성능을 보였지만, 개선된 H200 버전이나 곧 출시될 엔비디아 B200에는 크게 못 미치는 결과를 나타냈습니다.

 

AMD는 8개의 MI300X 프로세서를 탑재한 시스템에서 초당 23,512토큰(offline)의 속도를 기록했습니다. 이는 8개의 엔비디아 H100 SXM3 프로세서를 탑재한 시스템의 24,323토큰(offline)보다 약간 느린 수준입니다. 실제 서버 벤치마크에서는 AMD MI300X 시스템이 초당 21,028토큰으로 Nvidia H100 시스템의 20,605토큰보다 약간 빠른 속도를 보였습니다.

 

하지만 MI300X의 AI 최대 성능은 2.6 POPs(구조적 희소성 적용 시 5.22 POPs)인 반면 Nvidia H100의 최대 성능은 1.98 FP8/INT8 TFLOPS/TOPS(희소성 적용 시 3.96 TFLOPS/TOPS)입니다. 또 Nvidia의 H100 SXM3 모듈은 최대 대역폭 3.35TB/s의 80GB HBM3 메모리를 탑재한 반면, AMD의 Instinct MI300X는 최대 대역폭 5.3TB/s의 192GB HBM3 메모리를 탑재했습니다.

 

이론적으로 AMD MI300X가 Nvidia H100보다 성능 면에서 큰 이점을 가져야 하지만, 탐스하드웨어에 따르면 소프트웨어 스택으로 인해 하드웨어 기능을 최대한 활용하지 못하는 것으로 보입니다.

 

AMD는 처음으로 단일 및 8-way GPU 결과를 제출했으며, 엔비디아 H100과 경쟁할 수 있는 수준의 성능을 보여주었다는 점에서 의미가 있습니다. 하지만 현재는 Llama 2 70B 모델에 대한 MLPerf 4.1 생성형 AI 벤치마크 결과만 공개됐으며, 3D Unet, BERT, DLRM, GPT-J, Mixtral, Resnet, Retinanet, Stable Diffusion XL 등 나머지 8개 표준 벤치마크 결과는 공개되지 않았습니다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다😘
🥇소식게 수호자🥇미게 지박령🥉큰게 좋아🥇미코의 잡담왕🥈유게 공무원🥉할인 경보📝게시판 소유자✨️🥉에로게 심심이
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 19.11.15 9 51827
핫글 소식 美 법원 "디지털 콘텐츠에 '구매' 표현 금지" [1] new 뉴스봇 24.09.28 2 169
핫글 소식 6억명 비번 일반 텍스트로 저장해온 메타, 벌금 1억 150만 달러 BarryWhite 24.09.28 1 347
핫글 소식 "갤럭시S25 울트라, 16GB 램 탑재" 뉴스봇 24.09.28 1 431
63060 소식 SKT·SK브로드밴드, 800Gbps 대용량 유선망 도입 BarryWhite 24.09.03 0 142
63059 소식 미디어텍, AI SoC 제품 강화할 것 BarryWhite 24.09.03 0 91
63058 소식 악명 높던 애플 '파인우븐' 케이스, 출시 1년 만에 단종되나 뉴스봇 24.09.03 0 534
63057 소식 팀 쿡 이을 차기 애플 CEO 유력 후보 '존 터너스'는 누구? [1] 뉴스봇 24.09.03 0 327
63056 소식 "미니 PC로 충분한 이유" 비링크 SER5가 데스크톱 PC를 밀어내다 [1] 뉴스봇 24.09.03 3 620
63055 소식 미 연방 법원, "SNS 컨텐츠 검열하면 안돼" file Stellist 24.09.03 0 110
63054 소식 윈도11, 스팀서 윈도10 제쳤다…점유율 49.17% 차지 뉴스봇 24.09.03 1 155
63053 소식 샤오미, 2만원대 무선 이어버드 '레드미 버즈6 라이트' 출시 뉴스봇 24.09.03 0 172
63052 소식 퀄컴, 스냅드래곤6 3세대 슬며시 공개…CPU 성능 10%↑ 뉴스봇 24.09.03 0 401
63051 소식 TSMC '1.6나노' 공정, 애플 이어 오픈AI도 선제 주문 뉴스봇 24.09.03 0 128
63050 소식 [서평은 아닙니다만] 곰돌이 푸가 보여주는 ‘다정한 리더십’의 힘 뉴스봇 24.09.03 0 115
63049 회원 팻 겔싱어, 인텔 이사회에 비용 절감 계획 제시 예상 BarryWhite 24.09.03 0 60
63048 소식 레노버, 8코어 스냅드래곤 X 플러스 탑재 코파일럿+ PC 공개 예정 [1] file BarryWhite 24.09.03 2 267
63047 회원 소니 PS5 프로 성능, 라데온 7700 XT와 비슷? BarryWhite 24.09.03 1 71
63046 회원 화웨이, 아이폰 16 발표날 3단 폴더블폰 공개 BarryWhite 24.09.03 0 56
63045 소식 EU DMA 주도한 베스테르 사임 예정 [1] BarryWhite 24.09.03 0 131
63044 소식 이노스페이스 "메탄엔진 연소시험 성공…발사체 '한빛'에 활용" file 크로아츠 24.09.03 0 115
63043 소식 [그게 뭔가요] 진짜로 속여 피해 유발하는 ‘딥페이크’ 뉴스봇 24.09.02 0 205
63042 소식 넥슨 ‘퍼스트디센던트’, 왜 이렇게 후끈? K겜심 달래기 관건 [3] 뉴스봇 24.09.02 2 629
63041 소식 [그게 뭔가요] ‘제2의 티메프사태’로 불리는 루멘페이먼츠 사건 뉴스봇 24.09.02 0 233
63040 소식 넥슨 총수 일가, 5조원대 상속세 조기 납부 완료..."경영 안정 최우선" 뉴스봇 24.09.02 0 308
63039 소식 딥페이크 포르노 사이트, 구글·애플 로그인 가능…"우려스러워" 뉴스봇 24.09.02 0 424
63038 소식 통신 전유물 ‘주파수’ 타 산업에 개방…UAM 현대차도 제4이통 문호 열려 뉴스봇 24.09.02 0 157
63037 소식 삼성전자, EUV 공정 개선 위해 TEL 'GCB' 장비 테스트 중 뉴스봇 24.09.02 1 462
63036 소식 삼성 갤Z플립6 판매부진 속...中환리 힌지 점유율 50% 육박 뉴스봇 24.09.02 1 539
63035 소식 시스크로 더 간단해진 닷넷 웹 API 알아보기 뉴스봇 24.09.02 0 117
63034 소식 삼성전기, 퀄컴 2024년 공급업체 부품상 수상 뉴스봇 24.09.02 1 277
63033 소식 시민단체, 공정위에 알리·테무 불공정약관 심사 청구 뉴스봇 24.09.02 0 105
63032 소식 애플 신제품 행사 '글로우타임'서 맥OS 세쿼이아 공개될 듯 뉴스봇 24.09.02 0 263
63031 소식 日 포켓몬스터, NFT 관련 특허 취득 뉴스봇 24.09.02 0 137

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.