소식 AMD MI300X, LLM 추론 벤치 경쟁사 대비 3배 빨라

BarryWhite
조회 수 175
2024.06.14. 06:43

AI 클라우드 제공업체 텐서웨이브는 LLM(대규모 언어 모델) 추론 AI 워크로드에서 AMD의 MI300X 가속기와 NVIDIA의 H100을 비교하는 벤치마크를 실시, 결과를 공개했습니다.

그 결과 AMD MI300X는 오프라인 테스트에서 다양한 배치 크기에서 엔비디아 H100보다 최대 3배 빠른 추론 속도를 제공하면서 인상적인 성능을 입증했습니다.

실제 채팅 애플리케이션을 시뮬레이션하는 온라인 테스트에서 MI300X는 낮은 지연 시간을 유지하면서 두 개의 H100 GPU에 비해 33% 더 높은 처리량(초당 요청 수)을 달성했습니다.

AMD의 MI300X는 원시 속도 면에서 H100을 능가할 뿐만 아니라, 공급 제약에 직면한 H100과 달리 가격 경쟁력도 뛰어나며 쉽게 구할 수 있습니다.

텐서웨이브는 MI300X의 장점을 강조하며 AI 추론 능력을 확장하고자 하는 기업에게 탁월한 선택이라고 추천했습니다.

살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다😘

🥇소식게 수호자🥇미게 지박령🥉큰게 좋아🥇미코의 잡담왕🥈유게 공무원🥉할인 경보📝게시판 소유자✨️🥉에로게 심심이

에디터로 글쓰기

번호	분류	제목	글쓴이	날짜		조회 수
공지	소식	IT 소식 게시판 이용 수칙 230127	admin	19.11.15	9	51712
핫글	소식	아이폰16의 Wifi 7, 속도 느리고 대역폭 제한있어 [1]	Stellist	09:46	2	496
핫글	소식	6억명 비번 일반 텍스트로 저장해온 메타, 벌금 1억 150만 달러	BarryWhite	11:07	1	273
핫글	소식	VIVO, 최초로 안드로이드15 정식 업데이트 시작	Stellist	09:07	1	331
48501	소식	"fps 조금 더 올리자고?" 팩토리 오버클럭, 돈 값 하나	뉴스봇	24.09.20	0	303
48500	소식	화웨이, 잠수 가능한 스마트워치 Watch GT5 Pro 발표 [2]	Stellist	24.09.20	0	266
48499	소식	화웨이, 새 스마트워치 Watch GT5 발표	Stellist	24.09.20	0	181
48498	소식	AI 기능 강화된 윈도우 11 24H2 업데이트, 10월부터 순차 배포 예정	뉴스봇	24.09.20	0	146
48497	소식	애플 A16 칩, TSMC 애리조나 공장에서 초기 생산 중…2025년 본격 가동 예상	뉴스봇	24.09.20	0	233
48496	소식	How-To : 크롬에 숨겨진 '링크 미리보기' 기능 활성화하는 방법	🤏tozoom	24.09.20	1	1564
48495	소식	방치형 키우기, 하이퍼 캐주얼보다 낫네	뉴스봇	24.09.20	0	150
48494	소식	GPD 듀얼 OLED 스크린 노트북 가격 공개...최대 1971달러	BarryWhite	24.09.20	0	248
48493	소식	팰월드 개발사: 닌텐도 소송 근거 몰라...인디 개발자 창의력 막지마라	BarryWhite	24.09.20	1	1764
48492	소식	삼성 갤럭시 S25 코드명, 패러다임	BarryWhite	24.09.20	0	481
48491	소식	아이폰 17 3nm 프로세서 유지...아이폰 18 프로부터 2nm 탑재 전망	BarryWhite	24.09.20	0	327
48490	소식	소니, PS1 스타일 한정판 PS5 공개	BarryWhite	24.09.20	0	232
48489	소식	화웨이, 혈압 측정가능한 스마트워치 Watch D2 발표 [1]	Stellist	24.09.20	0	220
48488	소식	EU, 아이폰이 타사 악세서리에 더 개방적으로 호환되길 원해 [4]	Stellist	24.09.20	2	2822
48487	소식	[이진호의 시선] 전략이 실패했지만, 웃은 오라클	뉴스봇	24.09.19	0	158
48486	소식	니트로스튜디오, 넥슨코리아로부터 자금 차입 연장	뉴스봇	24.09.19	1	1178
48485	소식	한국IDC, 2024년 상반기 국내 태블릿 시장 169만대 출하… 디태처블 태블릿 비중 증가	뉴스봇	24.09.19	0	154
48484	소식	HBM 생산 전환으로 D램 가격 상승 [4]	BarryWhite	24.09.19	0	460
48483	소식	뉴럴링크 '블라인드사이트' FDA 혁신기기 선정	뉴스봇	24.09.19	0	94
48482	소식	애플, '언더패널페이스ID' 적용 늦어져...디스플레이 업계 고민 커진다 [2]	뉴스봇	24.09.19	0	521
48481	소식	클라우데라, 신규 머신러닝 프로젝트 가속기 공개··· "클릭 한 번으로 AI 도입 지원"	뉴스봇	24.09.19	0	63
48480	소식	'더 라스트 오브 어스' 시즌2, 2025년 상반기 공개…정확한 날짜는? [1]	뉴스봇	24.09.19	0	297
48479	소식	환경부, 국내 안전기준 부적합 해외직구 제품 69개 유통 차단	뉴스봇	24.09.19	1	1237
48478	소식	삼성 갤럭시탭 S10 시리즈 출시 임박	뉴스봇	24.09.19	0	353
48477	소식	HTC 바이브, 고성능 XR 헤드셋 바이브 포커스 비전 출시	BarryWhite	24.09.19	0	149
48476	소식	인텔, 차세대 마이크로아키텍처 로열 코어 및 코브라 코어 개발 중?	BarryWhite	24.09.19	0	139
48475	소식	AMD, 전세대 CPU 재활용...라이젠 200 시리즈 출시?	BarryWhite	24.09.19	0	197
48474	소식	닌텐도, 포켓몬 표절 의혹 팰월드 소송 제기 [7]	BarryWhite	24.09.19	2	3841
48473	소식	iOS 18 ‘암호’ 앱의 신기능들	뉴스봇	24.09.19	0	294
48472	소식	"삼성전자 이어 2등"...中 샤오미, 애플 제꼈다	뉴스봇	24.09.19	0	259

👨‍👩‍👧‍👦미코🌕

소식 AMD MI300X, LLM 추론 벤치 경쟁사 대비 3배 빨라

스킨 기본정보

확장 변수

1. 게시판 기본 설정

2. 글 목록

3. 갤러리 설정

4. 글 읽기 화면

5. 댓글 설정

6. 글 쓰기 화면 설정