소식 엔비디아, 블랙웰 기반 듀얼랙 AI 서버 개발 중단
- BarryWhite
- 조회 수 87
- 2024.10.02. 18:07
엔비디아가 듀얼랙 구조의 72 GPU AI 서버인 GB200 NVL36*2 개발을 중단하는 것으로 알려졌습니다. 해당 제품은 블랙웰 아키텍처 기반 AI 칩 GB200이 36개씩 2개의 랙에 탑재되는 형태였습니다.
애널리스트 궈 밍 치는 최근 보고서를 통해 엔비디아가 제한된 자원 속에서 공급망 안정화, 경쟁 우위 확보, 고객 수요 충족 사이의 균형을 맞추기 위해 이런 결정을 내렸다고 분석했습니다.
궈 밍 치에 따르면, 엔비디아는 당초 NVL36, NVL72, NVL36*2 등 세 가지 GB200 프로젝트를 동시에 개발 중이었습니다.
그러나 NVL36 개발에 불확실성이 제기되면서, 엔비디아는 두 가지 72 GPU 버전(NVL72, NVL36*2)을 동시에 개발하는 데 어려움을 겪게 됐다고 합니다. 이에 따라 엔비디아는 제한된 개발 자원을 싱글랙 모델인 NVL72에 집중하기로 결정했습니다.
NVL72는 NVL36*2에 비해 여러 가지 장점을 가지고 있습니다.
첫째, NVL72는 싱글랙 구조로, NVL36*2 대비 데이터센터 공간 효율성을 높일 수 있습니다.
둘째, NVL72는 병렬 처리에 용이한 소프트웨어 설계를 통해 특히 자동 회귀 모델과 같이 병렬 처리가 어려운 추론 프로세스에서 NVL36*2보다 우수한 성능을 제공합니다.
셋째, 마이크로소프트와 같은 주요 고객들이 NVL36*2보다 NVL72를 선호하는 것으로 알려져 있습니다.
다만, NVL72 개발에는 몇 가지 기술적 과제가 존재합니다. 특히 NVL72는 역사상 가장 높은 수준인 132kW TDP(열 설계 전력)를 요구하기 때문에, 엔비디아와 공급망은 전례 없는 기술적 문제를 해결하는 데 더 많은 시간이 필요할 것으로 보입니다.
궈밍치는 NVL72의 양산이 엔비디아의 예상보다 늦어진 2025년 하반기로 미뤄질 수 있다고 전망했습니다.