
미니 잡담: 2400 GPU의 캐시 메모리는 몇 MB일까
- Section31
- 조회 수 598
- 2023.03.23. 17:24
** X920: 엑스클립스 920 // X940: 엑스클립스 940
사실 Xclipse 920의 모태로 짐작되는 라데온 660M의 L2 캐시는 무려 2 MB에 달합니다.
그러나 당시 삼파 4LPE 공정의 파멸적인(...) 퍼포먼스 때문에 면적을 최대한 억제하고자
여기서 반을 쳐내 1 MB의 L2 캐시로 세팅한 것으로 생각됩니다.
즉, 원래 제 성능을 내려면 2 MB L2 캐시가 필요한 것으로 짐작되는데,
과연 삼성이 엑시노스 2400의 GPU로 짐작되는 "Xclipse 940"(가칭)의 L2 캐시를,
대응하는 기성 제품인 라데온 680M ("렘브란트")의 L2 캐시인 2 MB, 또는
캐시 메모리 증가에 따른 성능향상 기대를 위해 그보다 좀 더 많이 둘 지가 관심사입니다.
Xclipse 920의 경우, 다이샷 그림을 구글로 검색해보시면 알겠지만,
1) 각 WGP마다 데이터 L0 캐시 32 KB, 명령어 L0 캐시 16 KB, 스칼라 L0 캐시 16 KB가 있습니다.
2) 그리고 GPU의 총 L1 캐시가 128 KB,
3) 거기에 L2 캐시가 256 KB 4개짜리로 도합 1 MB입니다.
덧: 모 회원분 曰, 대부분의 퀄컴 Adreno GPU의 L2 캐시가 64 KB라고 합니다.
물론 ATI가 모바일그래픽 사업부를 퀄컴에 팔았을 때의 GPU 아키텍처랑
지금 AMD의 RDNA 아키텍처랑 매우 다르기 때문에 1:1 비교는 좀 거시기하긴 합니다.

Galaxy Note9 512GB
- 이후 플랜: Galaxy S24 Ultra (If possible)
[Tablet]
Galaxy Tab S6 Lite
- 이후 플랜: iPad Air 6? 또는 mini 7?
[Laptop]
Dell XPS 13 9370 (이전) → (갤럭시 북3 (with ARC))
→ 맥북 에어 15 M2 (2023년식)






캐시사이즈는 cache hierarchy 측면에서 따져봐야지요.
AMD GPU, 콘솔칩 cache hierarchy보면 shader array 단위로 시작되고 결과만 산술적으로 보면 메모리버스 64bit당 L2$ 1MB씩 들어갑니다.
(shader array 1개에 L1$ 128KB 들어가는건 RDNA2에서 똑같이 나타남.)
그렇게 보면 메모리 버스 64비트인 모바일 AP에는 1MB가 맞지요.
X930은 WGP만 늘었지 SA개수는 그대로이니 1MB 그대로 갈듯하고
X940에서는 SA가 2개로 늘어서 2MB로 늘어날 명분은 있지요.
대신 밸런스 차원에서라도 지금 8MB인 시스템 레벨 캐시가 크게 늘어야 그게 가능할걸로 보입니다.



아키텍쳐가 완전히 다르기때문에 퀄컴과 cache size 를 1:1 비교하는게 맞는지 의문이네요.