로그인 해주세요.

AI / 로봇 게시판 *AI / 로봇에 관해 교류하는 게시판입니다.

BarryWhite

AI 세레브라스, 엔비디아 대비 20배 빠른 AI 추론 솔루션 출시

수정됨_Cerebras-20x-Hyperscaler-70B.jpg

 

인공지능(AI) 컴퓨팅 기업 세레브라스 시스템즈가 엔비디아보다 최대 20배 빠른 AI 추론 솔루션 '세레브라스 인퍼런스'를 출시했습니다.

 

세레브라스 인퍼런스는 대규모 언어 모델(LLM) '라마(Llama) 3.1' 8B에서 초당 1,800 토큰, 라마 3.1 70B에서 초당 450 토큰을 처리합니다. 이는 마이크로소프트 애저를 포함한 하이퍼스케일 클라우드에서 제공되는 엔비디아 GPU 기반 AI 추론 솔루션보다 약 20배 빠른 속도입니다.

 

세레브라스 인퍼런스는 획기적인 성능 향상뿐만 아니라 가격 경쟁력도 갖췄습니다. 예를 들어 100만 토큰 당 10센트의 가격으로 이용할 수 있어, 기존 GPU 클라우드 대비 최대 100배 높은 가격 대비 성능을 제공합니다. 세레브라스는 16비트 정확도와 20배 빠른 추론 속도를 통해 AI 앱 개발자가 속도나 비용 저하 없이 차세대 AI 애플리케이션을 구축할 수 있다고 설명했습니다.

 

이 혁신적인 가성비는 세레브라스 CS-3 시스템과 웨이퍼 스케일 엔진 3(WSE-3) AI 프로세서를 통해 가능했습니다. 특히 CS-3는 엔비디아 H100보다 메모리 대역폭이 7,000배 넓어 생성형 AI의 메모리 대역폭 기술적 과제를 해결했다고 합니다.

 

세레브라스 인퍼런스는 무료 티어, 개발자 티어, 엔터프라이즈 티어 등 세 가지 형태로 제공됩니다. 무료 티어는 로그인하는 모든 사용자에게 무료 API 액세스와 넉넉한 사용량 제한을 제공합니다. 개발자 티어는 유연한 서버리스 배포를 위해 설계되었으며, 라마 3.1 8B 및 70B 모델의 경우 100만 토큰 당 각각 10센트, 60센트의 가격으로 API 엔드포인트를 제공합니다. 엔터프라이즈 티어는 미세 조정된 모델, 맞춤형 서비스 수준 계약(SLA), 전담 지원을 제공합니다.

 

현재 AI 시장은 엔비디아가 장악하고 있지만, 세레브라스와 그록(Groq) 같은 기업들의 등장은 업계 역학 관계에 변화를 예고합니다. 특히 더 빠르고 비용 효율적인 AI 추론 솔루션에 대한 수요가 증가하고 있습니다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다😘
🥇소식게 수호자🥇미게 지박령🥉큰게 좋아🥇미코의 잡담왕🥈유게 공무원🥉할인 경보📝게시판 소유자✨️🥉에로게 심심이
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 AI AI / 로봇 게시판 이용 수칙 240418 [4] admin 24.04.18 3 261
64 AI 미드저니, 웹용 이미지 편집기 공개 BarryWhite 24.08.19 0 82
63 AI 오픈AI: 챗GPT로 허위 정보 유포한 이란 계정 차단 BarryWhite 24.08.19 0 111
62 AI 생성형AI로 폭풍 찾는다…엔비디아, 스톰캐스트 공개 BarryWhite 24.08.20 0 88
61 AI 엔비디아, 게임 캐릭터 대화 혁신 이끌 AI 모델 공개 BarryWhite 24.08.21 0 178
60 AI 앤트로픽, 美 작가들에게 저작권 침해 집단 소송 당해 BarryWhite 24.08.21 0 94
59 AI 사망한 배우 AI로 생성...에이리언: 로물루스 BarryWhite 24.08.22 1 327
58 AI 맥아피, AI 딥페이크 탐지 도구 공개 BarryWhite 24.08.22 0 66
57 AI Z세대: AI 사용, 유용하면서도 죄책감 들어 [1] BarryWhite 24.08.22 0 296
56 로봇 팔굽혀 펴기하는 아틀라스 BarryWhite 24.08.23 0 210
55 AI 아마존: AI 도구로 시간 절감…50일치를 몇 시간으로 BarryWhite 24.08.23 0 137
54 AI 구글, AI 스튜디오서 프롬프트 갤러리 무료로 제공 BarryWhite 24.08.23 0 116
53 AI (타 유튜브) AI 모델 학습이 인간 의존적일 수 밖에 없는 이유? [10] Oxc.suga 24.08.23 4 610
52 AI 핀드롭, 사람 목소리 모방하는 AI 잡아낸다 BarryWhite 24.08.27 1 47
51 AI MS, 최신 SLM 시리즈 공개 BarryWhite 24.08.27 0 223
50 AI 비디오 편집 Ai 질문입니다. [2] Polishe 24.08.27 0 111
AI 세레브라스, 엔비디아 대비 20배 빠른 AI 추론 솔루션 출시 file BarryWhite 24.08.28 0 136
48 AI 애리조나주립대, 올해의 교수로 챗GPT 임명 BarryWhite 24.08.28 0 142
47 AI 구글 제미니 앱, 화면 설명 기능 추가…유튜브 영상도 요약 가능 BarryWhite 24.08.28 0 134
46 AI 구글, AI 이미지 생성 도구 이마젠3 출시...인물 생성 기능 부활 BarryWhite 24.08.29 1 85
45 AI 클로드, 사용자 대화를 문서 변환하는 아티팩트 출시 BarryWhite 24.08.29 0 107
44 AI 콜로라도 경찰, AI 보고서 도우미 도입…바디캠 오디오 참고 BarryWhite 24.08.30 0 72
43 AI AI, 재무 설계사 대체 가능성? 신뢰 구축이 관건 BarryWhite 24.09.01 0 96
42 AI 구글, 기침소리로 결핵 판별 AI 모델 공개 BarryWhite 24.09.02 0 102
41 AI AI가 대답할 수 없는 간단한 질문 [3] file Starlight 24.09.02 5 389
40 AI 알리바바, 새 AI 모델 큐웬2-VL 공개…대학 수준 문제 거뜬 BarryWhite 24.09.03 0 105

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.