미니 GPU가 부족한 NPU/DSP 연산을 충당하려면
- 흡혈귀왕
- 조회 수 808
- 2023.02.19. 13:10
연산 성능이 압도적으로 좋거나
그래야 합니다.
흐음
일단 2.2GHz의 6WGP 스펙의
라데온 680m의 연산 성능을 보면
FP32 = 3.37TFLOPs
FP16 = 6.74TFLOPs
입니다.
여기서 클럭이 1.6GHz 수준이되면
FP32 = 2.45TFLOPs
FP16 = 4.9TFLOPs
성능이 나옵니다.
현재 719MHz 아드레노740의 이론상 연산 성능이
FP32 = 2.2TFLOPs
FP16 = 4.4TFLOPs
이니깐 적어도 1.6GHz 6WGP GPU가
719MHz 아드레노740 GPU보단 높습니다.
문제는 스냅드래곤8 Gen3 GPU랑 비교시
어찌될지 모릅니다.
그리고 애시당초 특정 연산성능에
특화된 NPU/DSP에
GPU 연산으로 보강은 한계가 있습니다.
괜히 업체들이 GPU가 있는데 AI 유닛을 추가하고
그러는게 아니거든요....
특정 연산에 특화되어있는 NPU/DSP를
GPU가 연산으로 따라잡는것도 말이 안되구요...
GPU 비중이 높아지면 그만큼
소비전력에 손해를 보고
다른 AP랑 튜닝 방법이 달라지니
여로므로 유쾌한 상황은 아닙니다.
삼성쪽은
CPU랑 GPU 신경보다 NPU쪽을 좀 더
신경써야합니다.
NPU+DSP인 주제에
퀄콤의 단일 DSP 대비 성능이 후달리는 상황이고
드라이버 지원도 좋지 못합니다.
뭔가 이쪽은 큰 전환점이 필요한데
엑시노스2200과 스냅드래곤8 Gen1의
스냅샷과 야간 비디오 차이 보면 후속작에서
격차가 더 벌어질까봐 걱정이 드네요...
8WGP 16CU로 늘리기엔 다이 사이즈가 모자라겠네요... 흠.