소식 엔비디아 RTX50 블랙웰 플래그십, 최대 192개의 SM 유닛 및 512비트 버스 갖춘 GB202 GPU 탑재
- BarryWhite
- 조회 수 494
- 2023.09.29. 13:29
엔비디아의 차세대 지포스 RTX 50 "블랙웰" GPU에 대한 루머가 Kopite7kimi와 같은 신뢰할 수 있는 유출자를 통해 퍼지기 시작했습니다.
엔비디아 지포스 RTX 50 "블랙웰" 플래그십은 SM 수 증가, 더 넓은 버스 인터페이스, 캐시 증가 등으로 RTX 40 시리즈를 기반으로 확장될 것으로 알려졌습니다.
엔비디아의 지포스 RTX 50 "블랙웰" GPU에 대한 루머는 이미 몇 달 전 마지막 지포스 RTX 40 GPU가 시장에 출시되었을 때 시작되었습니다. "Ada-Next"로 명명된 이 차세대 칩은 공식 로드맵에 따르면 2025년 출시일을 목표로 하는 NVIDIA의 새로운 게이밍 라인업의 기반이 될 것이지만, 출시가 더 앞당겨질 수도 있다는 소문도 있습니다.
자세한 내용부터 말씀드리자면, Kopite7kimi는 블랙웰 GPU의 두 가지 구성에 대해 X에 게시했습니다. 첫 번째는 최근 TSMC 3nm 공정 노드를 활용하고 2024년 말 출시(GTC 2024에서 발표)를 목표로 하는 것으로 알려진 GB100으로 알려진 HPC/AI 지향 칩입니다.
GB100 GPU는 MCM 설계를 활용하는 NVIDIA의 첫 번째 HPC 칩이 될 것으로 예상되며, 클러스터당 10개의 TPC를 포함하는 8개의 GPC 클러스터를 기반으로 하고 각 클러스터는 2개의 SM을 탑재하여 완전히 활성화된 다이에 총 160개의 SM 유닛을 탑재할 것입니다. 또한 상단 다이에는 8192비트 와이드 버스 인터페이스가 탑재되어 HBM3e와 같은 최신 HBM 표준을 지원할 것입니다.
암페어와 호퍼는 서로 다른 FP32/FP64 코어 수 배열을 특징으로 하지만, NVIDIA가 블랙웰의 SM당 128개의 FP32 코어 수를 따를 경우, 완전히 활성화된 다이에서 20,480개의 FP32 코어를 사용할 수 있게 됩니다. 다음은 NVIDIA HPC 부품을 Blackwell GB100과 비교한 것입니다:
A100(암페어) - 8GPC / 64TPC / 128SM / SM당 64코어 / 8192코어 / 5120비트
H100(호퍼) - 8GPC / 72TPC / 144SM / SM당 128코어 / 18,432코어 / 5120비트
B100(블랙웰) - 8GPC / 80TPC / 160SM / SM당 128코어 / 20,480코어 / 8192비트
다시 게이밍 부분으로 돌아가서, GB202 GPU는 이전 게이밍/HPC 출시에서 보았던 것과는 크게 다른 GPU 구성을 특징으로 한다는 소문이 돌고 있습니다. 이 칩은 총 8개의 TPC를 가진 12개의 GPC를 수용하여 전체 다이에서 최대 96개의 TPC 또는 192개의 SM을 수용 할 것으로 예상됩니다.
다시 한 번 말씀드리지만, NVIDIA가 SM당 동일한 128개의 FP32 코어를 사용한다면 최대 24,576개의 코어를 확보하게 되며, 이는 전체 AD102 GPU에 비해 코어 구성이 33% 향상되는 것입니다. 물론 아직 전체 AD102 GPU를 탑재한 게이밍 GPU가 출시되지 않았기 때문에 NVIDIA는 GPU 수율이 더 좋아지거나 경쟁에 대응할 필요가 있을 경우 차세대 GeForce RTX 50 게이밍 라인업과 함께 축소된 GB202 다이를 출시할 가능성이 높으며, 고급형 변형이 시장에 출시될 수도 있습니다.
NVIDIA는 GPU에 기존 코어만 추가하는 방식에서 벗어나 이제 GPU에 AI, Tensor, 신경 처리 및 레이 트레이싱 작업을 위한 다양한 유형의 코어와 가속기를 포함하고 있으므로, 블랙웰이 출시될 즈음에는 기존의 Ada Lovelace 구성이 구식 설계가 될 가능성이 높습니다.
Kopite7kimi는 또한 GeForce RTX 50 GPU용 NVIDIA GB202 "Blackwell" GPU가 기존 플래그십 칩에 탑재된 384비트 와이드 버스 인터페이스보다 33% 증가한 훨씬 더 넓은 512비트 버스 인터페이스를 제공할 것이라고 다시 한 번 강조합니다.
또한 Chiphell 포럼에서 나온 루머에 따르면 NVIDIA의 GeForce RTX 50 "블랙웰" 플래그십은 코어 수가 50% 증가하고, 메모리 대역폭이 52% 향상되었으며, 캐시 크기가 78% 증가하고, 코어 주파수가 15% 증가하여 전체 GPU 성능 기능이 70% 향상되었다고 합니다. NVIDIA가 GeForce RTX 50 플래그십 그래픽 카드의 최종 사양을 결정하기에는 아직 너무 이르며, 실제로 어떤 제품을 시장에 출시할지 결정하기 전에 여러 SKU를 작업하는 것으로 알려져 있으며 출시까지 1년이 남았기 때문에 이 시점에서 최종 사양이라고 부르는 것은 현명하지 않을 것입니다. 하지만 이러한 보고서에 따르면 지포스 RTX 50 GPU가 탑재될 것으로 보입니다:
24,576개의 CUDA 코어(GB202 GPU)
32Gbps 메모리 속도(GDDR7)
~3000MHz 피크 GPU 클럭 속도
128MB L2 캐시(GPU용)
삼성과 SK하이닉스는 이미 차세대 GPU 라인업을 위해 차세대 GDDR7 DRAM 모듈을 엔비디아에 샘플링하기 시작한 것으로 알려졌습니다. 새로운 모듈은 512비트 버스 인터페이스에서 최대 2TB/s의 대역폭을 제공하는 최대 32Gbps 핀 속도를 특징으로 할 것으로 예상됩니다. 이는 GDDR 대역폭 성능이 크게 향상되고 4090과 같은 현재 가장 빠른 RTX GPU보다 2배 증가된 것입니다.