로그인 해주세요.

AI / 로봇 게시판 *AI / 로봇에 관해 교류하는 게시판입니다.

BarryWhite

AI 세레브라스, 엔비디아 대비 20배 빠른 AI 추론 솔루션 출시

수정됨_Cerebras-20x-Hyperscaler-70B.jpg

 

인공지능(AI) 컴퓨팅 기업 세레브라스 시스템즈가 엔비디아보다 최대 20배 빠른 AI 추론 솔루션 '세레브라스 인퍼런스'를 출시했습니다.

 

세레브라스 인퍼런스는 대규모 언어 모델(LLM) '라마(Llama) 3.1' 8B에서 초당 1,800 토큰, 라마 3.1 70B에서 초당 450 토큰을 처리합니다. 이는 마이크로소프트 애저를 포함한 하이퍼스케일 클라우드에서 제공되는 엔비디아 GPU 기반 AI 추론 솔루션보다 약 20배 빠른 속도입니다.

 

세레브라스 인퍼런스는 획기적인 성능 향상뿐만 아니라 가격 경쟁력도 갖췄습니다. 예를 들어 100만 토큰 당 10센트의 가격으로 이용할 수 있어, 기존 GPU 클라우드 대비 최대 100배 높은 가격 대비 성능을 제공합니다. 세레브라스는 16비트 정확도와 20배 빠른 추론 속도를 통해 AI 앱 개발자가 속도나 비용 저하 없이 차세대 AI 애플리케이션을 구축할 수 있다고 설명했습니다.

 

이 혁신적인 가성비는 세레브라스 CS-3 시스템과 웨이퍼 스케일 엔진 3(WSE-3) AI 프로세서를 통해 가능했습니다. 특히 CS-3는 엔비디아 H100보다 메모리 대역폭이 7,000배 넓어 생성형 AI의 메모리 대역폭 기술적 과제를 해결했다고 합니다.

 

세레브라스 인퍼런스는 무료 티어, 개발자 티어, 엔터프라이즈 티어 등 세 가지 형태로 제공됩니다. 무료 티어는 로그인하는 모든 사용자에게 무료 API 액세스와 넉넉한 사용량 제한을 제공합니다. 개발자 티어는 유연한 서버리스 배포를 위해 설계되었으며, 라마 3.1 8B 및 70B 모델의 경우 100만 토큰 당 각각 10센트, 60센트의 가격으로 API 엔드포인트를 제공합니다. 엔터프라이즈 티어는 미세 조정된 모델, 맞춤형 서비스 수준 계약(SLA), 전담 지원을 제공합니다.

 

현재 AI 시장은 엔비디아가 장악하고 있지만, 세레브라스와 그록(Groq) 같은 기업들의 등장은 업계 역학 관계에 변화를 예고합니다. 특히 더 빠르고 비용 효율적인 AI 추론 솔루션에 대한 수요가 증가하고 있습니다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다.
📝게시판 소유자(1)✨️🥇미게 지박령🥇미코의 잡담왕🥇소식게 수호자🥉에로게 심심이🥈유게 공무원🥉큰게 좋아🥉할인 경보
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 AI AI / 로봇 게시판 이용 수칙 240418 [4] admin 24.04.18 3 247
293 AI 애리조나주립대, 올해의 교수로 챗GPT 임명 BarryWhite 10:02 0 51
AI 세레브라스, 엔비디아 대비 20배 빠른 AI 추론 솔루션 출시 file BarryWhite 05:45 0 68
291 AI 비디오 편집 Ai 질문입니다. [2] Polishe 24.08.27 0 61
290 AI MS, 최신 SLM 시리즈 공개 BarryWhite 24.08.27 0 186
289 AI 핀드롭, 사람 목소리 모방하는 AI 잡아낸다 BarryWhite 24.08.27 1 32
288 AI (타 유튜브) AI 모델 학습이 인간 의존적일 수 밖에 없는 이유? [10] Oxc.suga 24.08.23 4 561
287 AI 구글, AI 스튜디오서 프롬프트 갤러리 무료로 제공 BarryWhite 24.08.23 0 98
286 AI 아마존: AI 도구로 시간 절감…50일치를 몇 시간으로 BarryWhite 24.08.23 0 119
285 로봇 팔굽혀 펴기하는 아틀라스 BarryWhite 24.08.23 0 189
284 AI Z세대: AI 사용, 유용하면서도 죄책감 들어 [1] BarryWhite 24.08.22 0 271
283 AI 맥아피, AI 딥페이크 탐지 도구 공개 BarryWhite 24.08.22 0 58
282 AI 사망한 배우 AI로 생성...에이리언: 로물루스 BarryWhite 24.08.22 1 297
281 AI 앤트로픽, 美 작가들에게 저작권 침해 집단 소송 당해 BarryWhite 24.08.21 0 86
280 AI 엔비디아, 게임 캐릭터 대화 혁신 이끌 AI 모델 공개 BarryWhite 24.08.21 0 166
279 AI 생성형AI로 폭풍 찾는다…엔비디아, 스톰캐스트 공개 BarryWhite 24.08.20 0 80
278 AI 오픈AI: 챗GPT로 허위 정보 유포한 이란 계정 차단 BarryWhite 24.08.19 0 105
277 AI 미드저니, 웹용 이미지 편집기 공개 BarryWhite 24.08.19 0 72
276 AI 메타 라마 3.1 미세 조정한 에르메스3 등장 BarryWhite 24.08.19 0 103
275 AI 긱벤치 AI 등장 BarryWhite 24.08.16 0 204
274 AI 中 AI 챗봇 토키, 美서 인기 BarryWhite 24.08.16 0 95
273 AI 신장결석 수술로봇 중 세계 첫 AI 탑재 BarryWhite 24.08.15 0 108
272 AI 광복절에 적절한 영상 [1] 곰장수 24.08.15 1 194
271 AI 실험 및 논문 작성해주는 AI 사이언티스트 등장 BarryWhite 24.08.14 0 114
270 AI 美, AI로 시험관 아기 시술 자동화 도전 BarryWhite 24.08.14 0 58
269 AI 모든 업무를 음성으로…구글, 제미나이 라이브 공개 BarryWhite 24.08.14 0 66

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...