미니 잡담: 2400은 GPU, 2500은 NPU를 소생할 필요가 있다고 봅니다.
- Section31
- 조회 수 837
- 2023.03.08. 19:29
주석: 이하 모든 값은 허구의 시나리오이므로, 시간이 지남에 따라 실제 값은 다를 수 있음.
Note: All datas below are hypothetical scenarios; actual data may vary in the future.
위의 표는 제가 생각하는 그나마 현실적인 시나리오입니다. (2200 CPU 정정: 약열세~동급)
각 AP에 대응하는 경쟁상대는 8G1 (vs. 2200), 8G3 (vs. 2400), 8G4 (vs. 2500) 입니다.
2400의 경우, 현재 상황에서 CPU, GPU, NPU 셋 다 잡을 수는 없다고 봅니다.
만약 무리해서 그렇게 하다가는 셋 다 놓치는 최악의 사태가 발생할 수도 있을 것입니다.
그렇다면 일단 2400은 CPU와 GPU 둘을 잡고,
NPU는 어쩔 수 없이 연산성능이 44 TOPs 라는 상태에서 극한의 세트단 튜닝에 기대야 합니다.
† GPU 기준을 살펴보면...
2400의 GPU가 mRDNA2 기반 6 WGP (12CU) 구성이라고 하므로,
SP개수 × 클럭 × 2 ÷ 100만 = FP32 연산성능 [TFlops] 공식으로 계산해보면,
Adreno 740 (719 MHz) [8G2] 을 이기려면 1.6 GHz 이상,
G13G MP8 (1.28 GHz) [M1] 을 이기려면 1.7 GHz 이상,
Adreno 750 (? MHz) [8G3] 을 이기려면 1.75~1.8 GHz 이상
이 정도가 필요하다는 계산이 대충 나옵니다. 단, 이 계산은 단순 성능만 따졌을 때입니다.
제가 볼 때, 2400의 GPU를 소생시키는 데 필요한 마일스톤 값은 1.7 GHz입니다.
또한, 미디어텍 Dimensity 9200의 Mali GPU가 파워를 엄청나게 먹어서 빛이 바랜 것을
타산지석으로 하여, 풀로드 시 1 CU 당 파워 소모량을 줄이는 것이 관건입니다.
만약 2400의 GPU를 소생에 성공한다면,
이제 다음 목표는 2500에서 NPU를 소생시켜야 합니다. (단, GPU는 동급이라는 전제 하)
NPU는 8젠4와 비슷한 성능을 내려면 제 생각에는 70 TOPs는 필요할 것으로 예상됩니다.
그간 삼성이 NPU에서 부동소수점 연산성능에 치중하고 정수 연산성능에는 소홀히한 면이 있으므로,
정수 연산성능의 개선이 얼마나 될 지가 최대의 관건입니다.
그리고 마지막으로, 캐시 메모리 용량을 늘릴 필요가 있습니다.
물론 캐시 메모리의 특성상 면적 및 비용 문제가 큰 편입니다.
하지만 기준치보다 낮은 양의 캐시 메모리를 넣으면 제 성능을 못 낼 수 있기에,
2400에서는 L3 캐시는 8 MB, 시스템 캐시는 8~16 MB 정도 넣고,
2500에서는 L3 캐시는 8~16 MB, 시스템 캐시는 16 MB 이상 넣으면
성능개선에 큰 도움을 줄 것으로 보입니다.
그래서 제가 볼 때 2400의 가장 큰 변수는 GPU이고, 2500은 NPU라고 생각합니다.
특히 일단 1차 캐삭빵(...)인 2400이 성공하려면 CPU는 리스크가 거의 없을 듯한데, GPU가 큰 관건입니다. AMD의 RDNA2 아키텍처 발표 당시 파워vs클럭 커브 수준(1CU당 1.4W 파워 소모 @ 1800 MHz)에서,
1) 개선된 정도(1CU당 1~1.2W)로 보여주면 나쁘진 않고,
2) 1800 MHz일 때 1CU당 0.9W 정도 소모하면 대단한 수준이며,
3) 0.8W 이하면 대성공일 것입니다.
스냅보다 동급이면 출시 된 이후 온갖 조리돌림 당할듯합니다. 🤣
최소한 누가봐도 우위를 가지는게 아니면 엑시노스에 대한 열악한 신뢰감으로 인해 여러가지 의문/루머/억까/팩트등이 구분이 안된채 미게등이 활활 탈듯합니다. ㅎㅎ