로그인 해주세요.

미니기기 / 음향 게시판 *스마트폰과 PC, 카메라, 스피커 등 IT 미니기기와 음향기기에 관해 교류하는 게시판입니다.

미니 모바일 AP 내에 들어가는 GPU 스펙 정리

  • ATNT
  • 조회 수 1558
  • 2020.11.19. 19:29

Mali-G77-21.png

Mali-G77-19.png

 

G77 / G78은 일단 Diagram 상으로는 둘 다 동일한 스펙을 가지고 있습니다. 물론 G78이 전력이나 다이 크기 면에서는 더욱 최적화가 이뤄졌겠지요.

 

일단. 발할라 아키텍쳐는 MP1당 32개의 FMA 연산 유닛, 그리고 보통 말리는 FLOPS 발표할 때 SFU까지 끼워넣는데 SFU까지 합하면 80 ops/cycle의 연산이 가능합니다.

 

그리고 각 코어당 TMU는 4 Texel/cycle, ROP는 2 Pixel/cycle의 성능을 뽑아낼 수 있습니다.

 

엑시노스 990 (G77 MP11@800MHz) - 440SP : 44TMU : 22ROP - 704GFLOPS : 35GTex : 18GPix

엑시노스 1080 (G78 MP10) - 400SP : 40TMU : 20ROP - (700MHz라고 가정시)560GFLOPS : 28GTex : 14GPix

엑시노스 2100 (G78 MP14) - 560SP : 56TMU : 28ROP - (700MHz라고 가정시)784GFLOPS : 39GTex : 20GPix

 

내년에는 875와 2100이 맞붙을 것이고, 내후년쯤 되어야 RDNA2 달린 엑시노스가 나올텐데 그때쯤 되면 1024~1536SP 정도 구성으로 벌크업 하고 나와야 아드레노랑 상대가 될듯 하네요.

 

6.png

03_Mali-G76 Deep Dive_NoWM_12.png

Mali-G76은 각 실행유닛당 8-Wide ALU, 그리고 MP1당 이 EU가 3개씩 들어가지요. MP1당 TMU와 ROP는 각각 2개씩 들어갑니다. 실제 엑시노스 9820은 MP12의 구성을 갖추었지요.

 

엑시노스 9820 (G76 MP12@702MHz) - 288(+ ??)SP : 24TMU : 24ROP - 404(+ ???)GFLOPS : 17GTex : 17GPix

 

페이퍼 스펙은 낮은데, 오히려 이정도 스펙으로 A640과 맞붙은게 대단하게 느껴지네요.

물론 덕분에 MP12 구성이라서 다이사이즈는 저 멀리 날아가고, 실제 SP:TMU:ROP 수는 보잘것 없으면서도, 말리 특유의 비효율성 덕분에 엑시노스가 욕 씨게 먹었지만요.

 

adreno.PNG

 

(해당 자료는 퀄컴 공식 자료이며, 저 연산성능은 585MHz로 돌아간 결과인 것으로 보입니다.)

 

Adreno 600 시리즈는 보통 MP2 구성으로 이뤄져 있습니다.

 

845에 들어간 A630은 MP1당 256ALU, 855에 들어간 A640은 MP1당 384, 865에 들어간 A650은 MP1당 512개의 구성을 가집니다.

각 MP1당 TMU는 12, 24, 24 개 들어가며, ROP는 8, 8, 12개 들어갑니다.

 

연산성능은 ALU * 2 * 클럭으로 딱 떨어지지는 않습니다. 그래서 위의 사진을 보면 텍스쳐 필레이트는 585M*48=28.1G, 픽셀 필레이트는 585M*16=9.4G로 정확히 맞아 떨어지지만, FP32 연산성능은 585M*768*2=899G가 아닌 585M*816*2=955G라고 광고하고 있지요. 아마 Mali처럼 부수적인 SFU(아마 SP 수로 따지면 48SP정도일겁니다.)같은 부분의 연산성능까지 합산한 결과일 것입니다.

 

스냅드래곤 845 (Adreno 630 MP2@710MHz) - 512(+48?)SP : 24TMU : 16ROP - 795GFLOPS : 17GTex : 11GPix

스냅드래곤 855 (Adreno 640 MP2@585MHz) - 768(+48?)SP : 48TMU : 16ROP - 955GFLOPS : 28GTex : 9.4GPix

스냅드래곤 865 (Adreno 650 MP2@587MHz) - 1024(+48?)SP : 48TMU : 24ROP - 1.26TFLOPS : 28GTex : 14GPix

 

865 기준으로 경쟁상대인 990과 비교시 연산성능은 앞지르고, 텍스쳐 필레이트나 픽셀 필레이트는 딸리는 것을 볼 수 있지요. 뭐 예전 Mali-400MP4 vs A220/A225때부터 지금까지 이건 종특인거 같습니다. 다만 Geekbench 렌더스크립트 기준으로는 결과가 들쑥날쑥 개판인걸 보면 제 성능이 잘 발휘되는거 같진 않네요.

 

Apple_GPU_Keynote.jpg

 

A14는 MP4 구성, M1은 동일한 GPU를 MP7/8 구성으로 이뤘습니다.

일전에 제가 예측했고, 이번에 Anandtech 에서 적었듯이, 8코어 기준으로 128개의 EU, 그리고 1024개의 SP와 64개의 TMU, 32개의 ROP를 가진 것으로 보입니다.

 

A14 (PowerVR 마개조 자체 MP4) - 512SP : 32TMU : 16ROP - (700MHz라고 가정시)717GFLOPS : 22GTex : 11GPix

M1 (PowerVR 마개조 자체 MP8@1275MHz) - 1024SP : 64ROP : 32TMU - 2.6TFLOPS : 82GTex : 41GPix

 

클럭이 드러나지 않은 GPU들은 일단 무난하게 모두 700MHz라고 가정하고 계산한겁니다.

의외로 A14의 결과가 꽤 낮은데 그만큼 애플이 Metal API를 잘 이용해 먹고 있다는 것이 아닐까 싶네요.

M1은 저 스펙 보고 1050Ti~1650쯤은 나오지 않을까 싶었는데, 실제로도 그정도로 나오더라고요.

댓글
21
EXYNOS
1등 EXYNOS
2020.11.19. 19:31

말리가 성능을 뽑아내려면 코어가 많이 필요하군요..

[EXYNOS]님의 댓글을 신고합니다. 취소 신고
맛깔나는밥
맛깔나는밥 EXYNOS 님께
2020.11.19. 21:13

원래 말리는 저클럭 다코어....문제는 항상 다이 사이즈였죠.

[맛깔나는밥]님의 댓글을 신고합니다. 취소 신고
2등 후라이드치킨
2020.11.19. 19:38

아드레노가 MP2개로 이루어진지 오늘 알았네요... 

유용한지식 감사합니다....

[후라이드치킨]님의 댓글을 신고합니다. 취소 신고
글쓴이
ATNT 후라이드치킨 님께
2020.11.19. 19:53

PC GPU와 비교해봐도 이례적으로 엄청 많이 때려넣는 편입니다. 덕분에 다이사이즈는 작지만, 병목 덕분에 이론상의 FP32 성능이 온전히 드러나지는 않겠지요. 그래서 그런진 몰라도 원래는 A14도 충분히 넘겨줘야 할 친구가 비실비실하긴 합니다.

[ATNT]님의 댓글을 신고합니다. 취소 신고
글쓴이
3등 ATNT
2020.11.19. 20:00

아 그리고 이론치가지고 누가 잘났네 못났네 해봐야 별 쓸모 없습니다. 예전 A9도 210GFLOPs 따리였어요. 아마 810의 A430보다 많이 쳐지고, 7420의 T760 MP8과 비교해도 더 딸렸을 거에요. 그런데 현실은 A9의 GPU(이름 잘 기억 안나네요)가 다 찢어버렸지요.

[ATNT]님의 댓글을 신고합니다. 취소 신고
개구리
개구리
2020.11.19. 20:06

A14는 824GFLOPS입니다

[개구리]님의 댓글을 신고합니다. 취소 신고
글쓴이
ATNT 개구리 님께
2020.11.19. 20:04

위키 검색해서 나오는것들중 맞는거 거의 없습니다. 애초에 PowerVR때랑은 다르게 애플은 자사의 커스텀 GPU의 제원을 이번 M1 발표 이전까지 힌트라도 준적은 단 한번도 없었으니깐요.

 

 그래도 저 700MHz는 제가 클럭 몰라서 끼워넣은건데, 말씀하신 대로라면 아마 A14의 GPU는 800MHz 겠네요.

[ATNT]님의 댓글을 신고합니다. 취소 신고
글쓴이
ATNT 후라이드치킨 님께
2020.11.19. 20:14

이런 류의 사이트 신뢰도가 바닥인게

 

https://www.cpu-monkey.com/en/igpu-arm_mali_g72_mp18-201

 

여기서 보면 9810의 GPU는 FP32 연산성능이 무슨 561GFLOPs 라고 하더라고요. 애초에 클럭을 0.85GHz로 잡은 시점에서 맞을 수가 없지요.

 

https://www.anandtech.com/show/12520/the-galaxy-s9-review/6

 

실제 아난드텍쪽 데이터 참고하면

 

On the Exynos Galaxy S9 we also see the new ARM Mali G72MP18 running at 572 MHz. The new GPU doesn’t have any higher level changes in raw specifications, however it promises micro-architectural improvements that improves the IPC of the GPU. A raw theoretical spec calculation results in 247 GFLOPs (FMADD only – 370 GFLOPs when adding the FADD units), 10.3 GTexels and GPixels/s. 

 

[ATNT]님의 댓글을 신고합니다. 취소 신고
후라이드치킨 ATNT 님께
2020.11.19. 20:22

그렇군요.... 572mhz가 맞는데 850mhz로 잡았네요..ㅋㅋㅋㅋㅋㅋㅋ 왜 저렇게 표기했을까요.....

[후라이드치킨]님의 댓글을 신고합니다. 취소 신고
글쓴이
ATNT 후라이드치킨 님께
2020.11.19. 20:32

https://www.cpu-monkey.com/en/igpu-apple_a13-156

 

게다가 유일한 힌트가 MP4라는 것 밖에 드러나지 않은 A13 GPU의 GFLOPS 값은 어떻게 나온건지도 궁금하네요.

 

https://www.cpu-monkey.com/en/igpu-apple_a14-180

 

A14는 아예 셰이더 수 0 이라고 적혀있더라고요.

클럭도, SP 수도 모르는 GPU를 대체 어떻게 이론상 FLOP 값을 예지한건지 궁금하긴 하네요.

 

https://www.highperformancegraphics.org/wp-content/uploads/2019/hot3d/mobile_gpu_power_and_performance.pdf

 

퀄컴 공식 자료 기준으로 954.7 GFLOPs인 물건이

 

https://www.cpu-monkey.com/en/igpu-qualcomm_adreno_640-160

 

여기서는 967 GFLOPS이 되었네요.

 

그래도 어느정도는 맞긴 한데 완전히 맞다고 볼 수는 없을거 같습니다.

[ATNT]님의 댓글을 신고합니다. 취소 신고
글쓴이
ATNT 후라이드치킨 님께
2020.11.19. 20:32

그래도 어느정도는 맞고 데이터 자체는 많이 쌓여있긴 하네요.

[ATNT]님의 댓글을 신고합니다. 취소 신고
후라이드치킨 ATNT 님께
2020.11.19. 20:33

내년 2100 GPU성능은 기대해봐도 되는 부분인가요??

[후라이드치킨]님의 댓글을 신고합니다. 취소 신고
글쓴이
ATNT 후라이드치킨 님께
2020.11.19. 20:39

그거야 전 모르지요 ㅋㅋ

 

그런데 엑시노스 측에는 꽤 많은 페널티가 있는거 같네요.

 

1. 아무리 잘 나와도 게임사쪽에서 최적화 안해주면 결국 성능 말아먹는게 Mali 입니다.

2. DS사업부가 짜는 스케쥴러가 개판이고 IM사업부 측에서도 내부적으로 fps 제한을 빡세게 걸지요.

3.(과거형이지만) 게임이나 3D 구동시에도 결국 어느정도 CPU는 돌아가는데 M5의 전력효율은 A77의 절반입니다. 그래서 쓰로틀링이 더 빡세게 걸릴수밖에... Cortex-X1이면 그래도 TDP 측면에서 여유가 생기지 않을까 싶네요.

4. 7LPE는 멀쩡했지만 유독 7LPP에서 Speed Gain이 7FFP는 커녕 7FF 수준에 머물렀습니다. 5LPE도 잘 나와줘야 할텐데 걱정이네요. 퀄컴 돌아온걸 보면 이쪽으로는 그래도 좀 나아진거 같지만요.

 

저 4가지가 제대로 씨게 겹친게 990이었지요. 오죽하면 Peak 성능은 865랑 비슷해도 Sustained 성능은 9820이랑 노는... 오히려 9825가 쓰로틀링 덜 걸린걸 생각하면 적어도 게이밍용으로는 9825가 더 괜찮지 않을까 싶을 정도였지요.

[ATNT]님의 댓글을 신고합니다. 취소 신고
포인트봇
포인트봇 ATNT 님께
2020.11.19. 20:37
ATNT 님, 2포인트 채굴 성공!
[포인트봇]님의 댓글을 신고합니다. 취소 신고
후라이드치킨 후라이드치킨 님께
2020.11.19. 20:53

아 855플러스는 15%오버클럭이였군요.... 

[후라이드치킨]님의 댓글을 신고합니다. 취소 신고
후라이드치킨 ATNT 님께
2020.11.19. 20:59

정확한 지식을 알려주셔서 감사합니다~~^^

[후라이드치킨]님의 댓글을 신고합니다. 취소 신고
개구리
개구리 ATNT 님께
2020.11.19. 20:07

위키에 그런것도 나오나요? ㄷ

[개구리]님의 댓글을 신고합니다. 취소 신고
RuBisCO
RuBisCO
2020.11.19. 23:57

이론상의 FP16/FP32 성능이 실제 어플리케이션에서의 성능으로 이어지지 않는건 실제 게이밍 환경에선 필레이트가 굉장히 중요한 요소이기에 그렇습니다. 좀 극단적으로 가게되면 필레이트가 2배가 되면 쉐이더 성능이 절반 이하여도 필레이트가 높은쪽이 실제 게이밍 성능에선 압살하게 됩니다.

[RuBisCO]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 공지 사이트 이용 수칙 230228 수정 file admin 18.08.04 113644 13
핫글 미니 애플페이가 못들어 온다고 했던건 [13] AurA 24.04.26 1171 27
핫글 미니 스냅 X에 필요 이상으로 비관적 반응이 많은 것 같습니다. [8] Eomjunsik 24.04.26 790 12
핫글 미니 솔직히 앎트북 미래는 밝다고 봐요 [3] 쌍피ㄷㄷ 24.04.26 431 8
89192 미니 저같은 분은 별로 없으시겠죠 [8] file 개구리 20.11.19 802 2
89191 미니 근데 루머란 이름의 설레발중에 본질적인게 얻어걸리는 경우가 꽤 보이긴 해요 [7] 갤럭시S2 20.11.19 286 0
89190 미니 유머) 엘지 루머 내부자정보 이야기해드립니다 [8] Alternative 20.11.19 960 8
89189 미니 더닝 크루거의 더닝좌는 도당채... [6] file Havokrush 20.11.19 311 3
89188 미니 꿈에서 본 얘기 해드립니다 [10] file ^^ 20.11.19 384 3
89187 미니 미국에 아는 지인이 있었더라면 [6] [성공]함께크는성장 20.11.19 381 0
89186 미니 다들 어디서 썰을 듣는지 모르겠어요 [14] 오리제 20.11.19 528 11
89185 미니 공수표 날리시는 분들 엄청 많네요 [25] file 폴드투를쓰는겁니다 20.11.19 1176 23
89184 미니 저려미 블투이어폰들도 점점 [11] 닝냥뇨 20.11.19 377 0
89183 미니 마소 갤탭 역대급인거 같은데요.. [6] ktky12 20.11.19 826 0
89182 미니 알리 배송속도 미쳤네요 [15] file 배붕이 20.11.19 448 2
89181 미니 엑시 1080 잘나온거 같은데요 [1] 플롱 20.11.19 409 0
89180 미니 A칩이 동급 대비 월등한 성능을 갖게 된 게 언제부터죠? [6] 대단함 20.11.19 463 0
89179 미니 갤탭7 특가나온거 살까 말까 고민되내요 [12] jangon 20.11.19 730 1
미니 모바일 AP 내에 들어가는 GPU 스펙 정리 [21] file ATNT 20.11.19 1558 12
89177 미니 A시리즈는 그래도 A네요 file BayDonuts 20.11.19 329 0
89176 미니 1080의 지속성능이 865아래라면., [24] EXYNOS 20.11.19 677 0
89175 미니 문득 든 폴드3 궁금한 점 [1] Terrapin 20.11.19 623 0
89174 미니 액티브2 ECG 센서 불량으로 수리중입니다. 이시우배찌 20.11.19 176 0
89173 미니 갤노트 시리즈와 폴더블 라인업의 통합에 대해... [9] 프로입털러 20.11.19 372 3
89172 미니 TSMC가 N4~5 화웨이땜빵이 쉽지않다는,, 아까 글의 연장선 [4] 갤러리별 20.11.19 395 0
89171 미니 삼성 갤럭시 Z 폴드 3 정보 [16] cozyplanes 20.11.19 1077 3
89170 미니 [블프] 갤탭7 마소 미국 공홈 할인 [25] file 띵똥 20.11.19 1038 1
89169 미니 얼음냥주의) HM2 센서도 좋지 않아 [16] file 전자개복치 20.11.19 770 0
89168 미니 엔비디아는 공정에 왜 공격적이지 않을까요 [12] 뇌이징 20.11.19 382 0

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...