AI 세레브라스, 엔비디아 대비 20배 빠른 AI 추론 솔루션 출시

BarryWhite
조회 수 136
2024.08.28. 05:45

수정됨_Cerebras-20x-Hyperscaler-70B.jpg

인공지능(AI) 컴퓨팅 기업 세레브라스 시스템즈가 엔비디아보다 최대 20배 빠른 AI 추론 솔루션 '세레브라스 인퍼런스'를 출시했습니다.

세레브라스 인퍼런스는 대규모 언어 모델(LLM) '라마(Llama) 3.1' 8B에서 초당 1,800 토큰, 라마 3.1 70B에서 초당 450 토큰을 처리합니다. 이는 마이크로소프트 애저를 포함한 하이퍼스케일 클라우드에서 제공되는 엔비디아 GPU 기반 AI 추론 솔루션보다 약 20배 빠른 속도입니다.

세레브라스 인퍼런스는 획기적인 성능 향상뿐만 아니라 가격 경쟁력도 갖췄습니다. 예를 들어 100만 토큰 당 10센트의 가격으로 이용할 수 있어, 기존 GPU 클라우드 대비 최대 100배 높은 가격 대비 성능을 제공합니다. 세레브라스는 16비트 정확도와 20배 빠른 추론 속도를 통해 AI 앱 개발자가 속도나 비용 저하 없이 차세대 AI 애플리케이션을 구축할 수 있다고 설명했습니다.

이 혁신적인 가성비는 세레브라스 CS-3 시스템과 웨이퍼 스케일 엔진 3(WSE-3) AI 프로세서를 통해 가능했습니다. 특히 CS-3는 엔비디아 H100보다 메모리 대역폭이 7,000배 넓어 생성형 AI의 메모리 대역폭 기술적 과제를 해결했다고 합니다.

세레브라스 인퍼런스는 무료 티어, 개발자 티어, 엔터프라이즈 티어 등 세 가지 형태로 제공됩니다. 무료 티어는 로그인하는 모든 사용자에게 무료 API 액세스와 넉넉한 사용량 제한을 제공합니다. 개발자 티어는 유연한 서버리스 배포를 위해 설계되었으며, 라마 3.1 8B 및 70B 모델의 경우 100만 토큰 당 각각 10센트, 60센트의 가격으로 API 엔드포인트를 제공합니다. 엔터프라이즈 티어는 미세 조정된 모델, 맞춤형 서비스 수준 계약(SLA), 전담 지원을 제공합니다.

현재 AI 시장은 엔비디아가 장악하고 있지만, 세레브라스와 그록(Groq) 같은 기업들의 등장은 업계 역학 관계에 변화를 예고합니다. 특히 더 빠르고 비용 효율적인 AI 추론 솔루션에 대한 수요가 증가하고 있습니다.

살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다😘

🥇소식게 수호자🥇미게 지박령🥉큰게 좋아🥇미코의 잡담왕🥈유게 공무원🥉할인 경보📝게시판 소유자✨️🥉에로게 심심이

에디터로 글쓰기

번호	분류	제목	글쓴이	날짜		조회 수
공지	AI	AI / 로봇 게시판 이용 수칙 240418 [4]	admin	24.04.18	3	261
64	AI	미드저니, 웹용 이미지 편집기 공개	BarryWhite	24.08.19	0	82
63	AI	오픈AI: 챗GPT로 허위 정보 유포한 이란 계정 차단	BarryWhite	24.08.19	0	111
62	AI	생성형AI로 폭풍 찾는다…엔비디아, 스톰캐스트 공개	BarryWhite	24.08.20	0	88
61	AI	엔비디아, 게임 캐릭터 대화 혁신 이끌 AI 모델 공개	BarryWhite	24.08.21	0	178
60	AI	앤트로픽, 美 작가들에게 저작권 침해 집단 소송 당해	BarryWhite	24.08.21	0	94
59	AI	사망한 배우 AI로 생성...에이리언: 로물루스	BarryWhite	24.08.22	1	327
58	AI	맥아피, AI 딥페이크 탐지 도구 공개	BarryWhite	24.08.22	0	66
57	AI	Z세대: AI 사용, 유용하면서도 죄책감 들어 [1]	BarryWhite	24.08.22	0	296
56	로봇	팔굽혀 펴기하는 아틀라스	BarryWhite	24.08.23	0	210
55	AI	아마존: AI 도구로 시간 절감…50일치를 몇 시간으로	BarryWhite	24.08.23	0	137
54	AI	구글, AI 스튜디오서 프롬프트 갤러리 무료로 제공	BarryWhite	24.08.23	0	116
53	AI	(타 유튜브) AI 모델 학습이 인간 의존적일 수 밖에 없는 이유? [10]	Oxc.suga	24.08.23	4	610
52	AI	핀드롭, 사람 목소리 모방하는 AI 잡아낸다	BarryWhite	24.08.27	1	47
51	AI	MS, 최신 SLM 시리즈 공개	BarryWhite	24.08.27	0	223
50	AI	비디오 편집 Ai 질문입니다. [2]	Polishe	24.08.27	0	111
	AI	세레브라스, 엔비디아 대비 20배 빠른 AI 추론 솔루션 출시	BarryWhite	24.08.28	0	136
48	AI	애리조나주립대, 올해의 교수로 챗GPT 임명	BarryWhite	24.08.28	0	142
47	AI	구글 제미니 앱, 화면 설명 기능 추가…유튜브 영상도 요약 가능	BarryWhite	24.08.28	0	134
46	AI	구글, AI 이미지 생성 도구 이마젠3 출시...인물 생성 기능 부활	BarryWhite	24.08.29	1	85
45	AI	클로드, 사용자 대화를 문서 변환하는 아티팩트 출시	BarryWhite	24.08.29	0	107
44	AI	콜로라도 경찰, AI 보고서 도우미 도입…바디캠 오디오 참고	BarryWhite	24.08.30	0	72
43	AI	AI, 재무 설계사 대체 가능성? 신뢰 구축이 관건	BarryWhite	24.09.01	0	96
42	AI	구글, 기침소리로 결핵 판별 AI 모델 공개	BarryWhite	24.09.02	0	102
41	AI	AI가 대답할 수 없는 간단한 질문 [3]	Starlight	24.09.02	5	389
40	AI	알리바바, 새 AI 모델 큐웬2-VL 공개…대학 수준 문제 거뜬	BarryWhite	24.09.03	0	105

👨‍👩‍👧‍👦미코🌕

AI 세레브라스, 엔비디아 대비 20배 빠른 AI 추론 솔루션 출시

추천 IT 소식 [1/]

스킨 기본정보

확장 변수

1. 게시판 기본 설정

2. 글 목록

3. 갤러리 설정

4. 글 읽기 화면

5. 댓글 설정

6. 글 쓰기 화면 설정