
미니 잡담: 4LPP+로 2400 GPU 클럭을 몇까지 올릴 수 있을까
- Section31
- 조회 수 514
- 2023.03.13. 13:48
가장 최신 데이터 기준으로 삼파 4nm 공정의 상대적 성능 향상치는 다음과 같습니다.
4LPE / SF4E = 1 (기준)
4LPP / SF4 = 1.08x
4LPP+ / SF4P = 1.19x
그렇다면 지금까지 알려진 엑스클립스(Xclipse) GPU의 정보는 대략 다음과 같습니다.
1) Xclipse 920 (X920) : 3WGP 6CU (384 SP) , 1306 MHz
2) Xclipse 930 (X930) : 4WGP 8CU (512 SP) , 1402~1600** MHz
3) Xclipse 940 (X940) [가칭] : 6WGP 12CU (768 SP) , ????? MHz
** 2300이 실사용을 위해 양산되었다고 시나리오를 가정할 경우 예상되는 최대 수치
성능계산 : SP × 클럭 × 2 ÷ 100만 = FP32 [TFlops]
위 식으로 FP32 연산성능을 계산하면 다음과 같습니다.
1) X920 : 384 × 1306 × 2 ÷ 100만 = 1.003 TFlops
2) X930 : 512 × 1402~1600 × 2 ÷ 100만 = 1.436~1.638 TFlops
3) X940 : 768 × (클럭) × 2 ÷ 100만 = 2.0×1.3** TFlops
∴ (필요한 X940 클럭) = 1,692 MHz → 1,700 ~ 1,800 MHz가 합리적
** Adreno 740의 실 연산성능 2.0 TFlops (719 MHz) 에 750이 30% 향상이라 가정할 경우
이런 까닭은 퀄컴 Adreno GPU는 256ALU = 1CU 인데, AMD RDNA2는 128SP = 1CU이기 때문입니다.
그런데 성능 향상이 4LPP는 4LPE 대비 +8%, 4LPP+는 4LPE 대비 +19%라고 합니다.
이제 여기서 머리를 싸매고 계산을 하고 있는데....
이 성능향상치라는 게 FP32 [TFlops] 같은 것인지, 아니면 클럭 [GHz]을 뜻하는 것인지 먼저 알아야하고,
X920~X940이 WGP 수가 같지 않기 때문에 이를 고려해 또 보정을 해야 하기 때문입니다.
또한 소비전력 발표 수치가 없는 탓에 위의 성능 향상 수치가 같은 소비전력에서 이런 것인지,
아니면 같은 성능에서 소비전력이 줄어서 이렇게 된 것인지도 고려해야 합니다.
Q1. 보통 삼파에서 성능향상 수치를 발표할 때 그 기준은 무엇일까요?
Q2. 이를 바탕으로 4LPP+에서 올릴 수 있는 클럭 최대수치 계산에 필요한 추가적인 요소가 있다면 그것은 무엇일까요?
(어우 머리아퍼)

Galaxy Note9 512GB
- 이후 플랜: Galaxy S24 Ultra (If possible)
[Tablet]
Galaxy Tab S6 Lite
- 이후 플랜: iPad Air 6? 또는 mini 7?
[Laptop]
Dell XPS 13 9370
- 이후 플랜: ????
흑흑 빨리 공정 성능이 검증됐으면 좋겠네요