미니 ???: 아드레노 750에서 ALU를 늘리고 싶은데...
- Section31
- 조회 수 440
- 2023.03.23. 15:17
그림1. TSMC N4 대 N4P의 성능 대 소비전력 모식도.
위는 TSMC N4 대 N4P의 알려진 데이터**를 바탕으로,
가공의 칩이 각각 N4와 N4P에서 생산되었을 때를 가정하여 그린 도표입니다.
그래서 성능과 소비전력 모두 a.u. (arbitrary unit; 임의 단위) 입니다.
** N4P는 N4 대비 같은 소비전력, 그러나 성능은 +6%
그래서 성능이 소폭 개선되었어도 소비전력은 변화가 없기 때문에,
무턱대고 아드레노 750(Adreno 750)에서 ALU 수를 768에서 더 늘렸다간
그에 비례해서 발열이 증가하기 십상입니다.
삼성전자가 엑시노스 2400의 GPU 개발 과정에서 6 WGP 카드를 꺼낸 게 좀 이른 감이 있겠으나,
퀄컴 역시 아드레노 740에서 730 대비 ALU 수를 50%나 더 늘린 것 또한 비슷한 느낌입니다.
왜냐면 845→855에서 256→384로 ALU수를 50% 늘린 것을 제외하면, 그 이후에는
IPC 개선으로 같은 ALU수에서 성능을 향상시키거나 아니면 ALU 수를 늘리더라도
1/3 (=33%) 만큼만 더 늘렸기 때문입니다. // 예: 384개 (888) → 512개 (SD 8/8+ Gen 1)
그러나 퀄컴 입장에서는 절대 성능과 전성비를 모두 잡으려면
어쩔 수 없이 ALU 수를 대폭 늘리는 길을 택했을 수도 있겠습니다.
(물론 낮은 클럭 구간 전성비는 잡았지만 높은 클럭 구간에선 짤없이...)
허나, 이미 ALU +50% 증가라는 패를 꺼낸 이상, 이제 남은 것은
사실상 두 가지, 즉 IPC 개선 또는 클럭 증가밖에 답이 없는데,
IPC 개선도 정체가 된다면 결국 남는 것은 클럭 올리는 것밖에 없습니다.
무작정 ALU 수 늘렸다간 엄청난 제조단가 및 제반 비용 증가 때문에 골치 아픕니다.
즉 퀄컴 입장에서는 어떻게든 발악(?)을 해서 성능을 올려야하는데,
그러면 발열은 급증하니까 앞이 캄캄한 상황이 올 수도 있는 ...
뭐 그런 상황이 올 수도 있겠습니다.
오히려 역으로 생각해보면 RDNA GPU 시리즈 아키텍처가
고클럭에서의 동작을 상정하고 개발된 것이기 때문에
4LPP+가 목표로 하는 고클럭 범위에 도달하면
충분히 경쟁해 볼 만하다고 생각합니다.
그렇게 된다면 이제 삼성은 6 WGP (12CU) 구성의 Xclipse 940에서
4LPP+가 뒷받침해줄 때 스케줄러 및 드라이버의 극한의 최적화로서
전성비와 성능 모두 경쟁해볼 만한, 드문 기회가 다가오고 있는 셈이 됩니다.
하지만 그 기회를 잡을지, 아니면 그저 눈 뜨고 놓칠지는 이제 삼성 S.LSI의 몫입니다.
얼마 전부터 보였던 루머대로 4LPP+가 매우 좋은 상태라면,
잘하면 GPU 클럭 1.8 GHz까지 도달할 수도 있을 것 같다는 생각이 들거든요.
참고로 엑시노스 2400의 GPU 스펙으로 짐작되는 값은 SP:TU:ROP = 768:48:32 입니다.
덧: 삼성 파운드리 4LPP+는 소비전력 데이터가 없어서 아쉽습니다.
만약 며칠 전 보인 루머대로 내부평가 결과 4LPP+가 N4P와 동급 또는 약우세(GEQ**) 라면,
소비전력 또한 비슷한 양상을 보일 것 같다는 생각이 듭니다.
** GEQ = Greater than or EQuivalent to
밑의 그림은 AMD가 RDNA2를 발표했을 때 클럭(MHz) 대 1CU당 소비전력(W)을 나타낸 것입니다.
제조공정은 TSMC 7nm. 그림대로라면 7nm 공정에서 1800 MHz 클럭일 때 1CU당 1.25 W 정도 소비하는 것으로 보이는데, 그렇다면 7nm 기준 6 WGP (12CU면) 15 W 정도 됩니다.
삼파 4LPP+가 TSMC N7 대비 소비전력을 몇 % 줄이냐에 따라서 12CU 소비전력이 달려 있을 거고,
거기에 기타 다른 부품(GP, PU, RZ 등) 소비전력까지 포함해서 최대한 억제가 되어야 할 겁니다.
유지력 작살날거 같은데요..둘다