로그인 해주세요.

미니기기 / 음향 게시판 *스마트폰과 PC, 카메라, 스피커 등 IT 미니기기와 음향기기에 관해 교류하는 게시판입니다.

미니 모바일 AP 내에 들어가는 GPU 스펙 정리

  • ATNT
  • 조회 수 1560
  • 2020.11.19. 19:29

Mali-G77-21.png

Mali-G77-19.png

 

G77 / G78은 일단 Diagram 상으로는 둘 다 동일한 스펙을 가지고 있습니다. 물론 G78이 전력이나 다이 크기 면에서는 더욱 최적화가 이뤄졌겠지요.

 

일단. 발할라 아키텍쳐는 MP1당 32개의 FMA 연산 유닛, 그리고 보통 말리는 FLOPS 발표할 때 SFU까지 끼워넣는데 SFU까지 합하면 80 ops/cycle의 연산이 가능합니다.

 

그리고 각 코어당 TMU는 4 Texel/cycle, ROP는 2 Pixel/cycle의 성능을 뽑아낼 수 있습니다.

 

엑시노스 990 (G77 MP11@800MHz) - 440SP : 44TMU : 22ROP - 704GFLOPS : 35GTex : 18GPix

엑시노스 1080 (G78 MP10) - 400SP : 40TMU : 20ROP - (700MHz라고 가정시)560GFLOPS : 28GTex : 14GPix

엑시노스 2100 (G78 MP14) - 560SP : 56TMU : 28ROP - (700MHz라고 가정시)784GFLOPS : 39GTex : 20GPix

 

내년에는 875와 2100이 맞붙을 것이고, 내후년쯤 되어야 RDNA2 달린 엑시노스가 나올텐데 그때쯤 되면 1024~1536SP 정도 구성으로 벌크업 하고 나와야 아드레노랑 상대가 될듯 하네요.

 

6.png

03_Mali-G76 Deep Dive_NoWM_12.png

Mali-G76은 각 실행유닛당 8-Wide ALU, 그리고 MP1당 이 EU가 3개씩 들어가지요. MP1당 TMU와 ROP는 각각 2개씩 들어갑니다. 실제 엑시노스 9820은 MP12의 구성을 갖추었지요.

 

엑시노스 9820 (G76 MP12@702MHz) - 288(+ ??)SP : 24TMU : 24ROP - 404(+ ???)GFLOPS : 17GTex : 17GPix

 

페이퍼 스펙은 낮은데, 오히려 이정도 스펙으로 A640과 맞붙은게 대단하게 느껴지네요.

물론 덕분에 MP12 구성이라서 다이사이즈는 저 멀리 날아가고, 실제 SP:TMU:ROP 수는 보잘것 없으면서도, 말리 특유의 비효율성 덕분에 엑시노스가 욕 씨게 먹었지만요.

 

adreno.PNG

 

(해당 자료는 퀄컴 공식 자료이며, 저 연산성능은 585MHz로 돌아간 결과인 것으로 보입니다.)

 

Adreno 600 시리즈는 보통 MP2 구성으로 이뤄져 있습니다.

 

845에 들어간 A630은 MP1당 256ALU, 855에 들어간 A640은 MP1당 384, 865에 들어간 A650은 MP1당 512개의 구성을 가집니다.

각 MP1당 TMU는 12, 24, 24 개 들어가며, ROP는 8, 8, 12개 들어갑니다.

 

연산성능은 ALU * 2 * 클럭으로 딱 떨어지지는 않습니다. 그래서 위의 사진을 보면 텍스쳐 필레이트는 585M*48=28.1G, 픽셀 필레이트는 585M*16=9.4G로 정확히 맞아 떨어지지만, FP32 연산성능은 585M*768*2=899G가 아닌 585M*816*2=955G라고 광고하고 있지요. 아마 Mali처럼 부수적인 SFU(아마 SP 수로 따지면 48SP정도일겁니다.)같은 부분의 연산성능까지 합산한 결과일 것입니다.

 

스냅드래곤 845 (Adreno 630 MP2@710MHz) - 512(+48?)SP : 24TMU : 16ROP - 795GFLOPS : 17GTex : 11GPix

스냅드래곤 855 (Adreno 640 MP2@585MHz) - 768(+48?)SP : 48TMU : 16ROP - 955GFLOPS : 28GTex : 9.4GPix

스냅드래곤 865 (Adreno 650 MP2@587MHz) - 1024(+48?)SP : 48TMU : 24ROP - 1.26TFLOPS : 28GTex : 14GPix

 

865 기준으로 경쟁상대인 990과 비교시 연산성능은 앞지르고, 텍스쳐 필레이트나 픽셀 필레이트는 딸리는 것을 볼 수 있지요. 뭐 예전 Mali-400MP4 vs A220/A225때부터 지금까지 이건 종특인거 같습니다. 다만 Geekbench 렌더스크립트 기준으로는 결과가 들쑥날쑥 개판인걸 보면 제 성능이 잘 발휘되는거 같진 않네요.

 

Apple_GPU_Keynote.jpg

 

A14는 MP4 구성, M1은 동일한 GPU를 MP7/8 구성으로 이뤘습니다.

일전에 제가 예측했고, 이번에 Anandtech 에서 적었듯이, 8코어 기준으로 128개의 EU, 그리고 1024개의 SP와 64개의 TMU, 32개의 ROP를 가진 것으로 보입니다.

 

A14 (PowerVR 마개조 자체 MP4) - 512SP : 32TMU : 16ROP - (700MHz라고 가정시)717GFLOPS : 22GTex : 11GPix

M1 (PowerVR 마개조 자체 MP8@1275MHz) - 1024SP : 64ROP : 32TMU - 2.6TFLOPS : 82GTex : 41GPix

 

클럭이 드러나지 않은 GPU들은 일단 무난하게 모두 700MHz라고 가정하고 계산한겁니다.

의외로 A14의 결과가 꽤 낮은데 그만큼 애플이 Metal API를 잘 이용해 먹고 있다는 것이 아닐까 싶네요.

M1은 저 스펙 보고 1050Ti~1650쯤은 나오지 않을까 싶었는데, 실제로도 그정도로 나오더라고요.

댓글
21
EXYNOS
1등 EXYNOS
2020.11.19. 19:31

말리가 성능을 뽑아내려면 코어가 많이 필요하군요..

[EXYNOS]님의 댓글을 신고합니다. 취소 신고
맛깔나는밥
맛깔나는밥 EXYNOS 님께
2020.11.19. 21:13

원래 말리는 저클럭 다코어....문제는 항상 다이 사이즈였죠.

[맛깔나는밥]님의 댓글을 신고합니다. 취소 신고
2등 후라이드치킨
2020.11.19. 19:38

아드레노가 MP2개로 이루어진지 오늘 알았네요... 

유용한지식 감사합니다....

[후라이드치킨]님의 댓글을 신고합니다. 취소 신고
글쓴이
ATNT 후라이드치킨 님께
2020.11.19. 19:53

PC GPU와 비교해봐도 이례적으로 엄청 많이 때려넣는 편입니다. 덕분에 다이사이즈는 작지만, 병목 덕분에 이론상의 FP32 성능이 온전히 드러나지는 않겠지요. 그래서 그런진 몰라도 원래는 A14도 충분히 넘겨줘야 할 친구가 비실비실하긴 합니다.

[ATNT]님의 댓글을 신고합니다. 취소 신고
글쓴이
3등 ATNT
2020.11.19. 20:00

아 그리고 이론치가지고 누가 잘났네 못났네 해봐야 별 쓸모 없습니다. 예전 A9도 210GFLOPs 따리였어요. 아마 810의 A430보다 많이 쳐지고, 7420의 T760 MP8과 비교해도 더 딸렸을 거에요. 그런데 현실은 A9의 GPU(이름 잘 기억 안나네요)가 다 찢어버렸지요.

[ATNT]님의 댓글을 신고합니다. 취소 신고
개구리
개구리
2020.11.19. 20:06

A14는 824GFLOPS입니다

[개구리]님의 댓글을 신고합니다. 취소 신고
글쓴이
ATNT 개구리 님께
2020.11.19. 20:04

위키 검색해서 나오는것들중 맞는거 거의 없습니다. 애초에 PowerVR때랑은 다르게 애플은 자사의 커스텀 GPU의 제원을 이번 M1 발표 이전까지 힌트라도 준적은 단 한번도 없었으니깐요.

 

 그래도 저 700MHz는 제가 클럭 몰라서 끼워넣은건데, 말씀하신 대로라면 아마 A14의 GPU는 800MHz 겠네요.

[ATNT]님의 댓글을 신고합니다. 취소 신고
글쓴이
ATNT 후라이드치킨 님께
2020.11.19. 20:14

이런 류의 사이트 신뢰도가 바닥인게

 

https://www.cpu-monkey.com/en/igpu-arm_mali_g72_mp18-201

 

여기서 보면 9810의 GPU는 FP32 연산성능이 무슨 561GFLOPs 라고 하더라고요. 애초에 클럭을 0.85GHz로 잡은 시점에서 맞을 수가 없지요.

 

https://www.anandtech.com/show/12520/the-galaxy-s9-review/6

 

실제 아난드텍쪽 데이터 참고하면

 

On the Exynos Galaxy S9 we also see the new ARM Mali G72MP18 running at 572 MHz. The new GPU doesn’t have any higher level changes in raw specifications, however it promises micro-architectural improvements that improves the IPC of the GPU. A raw theoretical spec calculation results in 247 GFLOPs (FMADD only – 370 GFLOPs when adding the FADD units), 10.3 GTexels and GPixels/s. 

 

[ATNT]님의 댓글을 신고합니다. 취소 신고
후라이드치킨 ATNT 님께
2020.11.19. 20:22

그렇군요.... 572mhz가 맞는데 850mhz로 잡았네요..ㅋㅋㅋㅋㅋㅋㅋ 왜 저렇게 표기했을까요.....

[후라이드치킨]님의 댓글을 신고합니다. 취소 신고
글쓴이
ATNT 후라이드치킨 님께
2020.11.19. 20:32

https://www.cpu-monkey.com/en/igpu-apple_a13-156

 

게다가 유일한 힌트가 MP4라는 것 밖에 드러나지 않은 A13 GPU의 GFLOPS 값은 어떻게 나온건지도 궁금하네요.

 

https://www.cpu-monkey.com/en/igpu-apple_a14-180

 

A14는 아예 셰이더 수 0 이라고 적혀있더라고요.

클럭도, SP 수도 모르는 GPU를 대체 어떻게 이론상 FLOP 값을 예지한건지 궁금하긴 하네요.

 

https://www.highperformancegraphics.org/wp-content/uploads/2019/hot3d/mobile_gpu_power_and_performance.pdf

 

퀄컴 공식 자료 기준으로 954.7 GFLOPs인 물건이

 

https://www.cpu-monkey.com/en/igpu-qualcomm_adreno_640-160

 

여기서는 967 GFLOPS이 되었네요.

 

그래도 어느정도는 맞긴 한데 완전히 맞다고 볼 수는 없을거 같습니다.

[ATNT]님의 댓글을 신고합니다. 취소 신고
글쓴이
ATNT 후라이드치킨 님께
2020.11.19. 20:32

그래도 어느정도는 맞고 데이터 자체는 많이 쌓여있긴 하네요.

[ATNT]님의 댓글을 신고합니다. 취소 신고
후라이드치킨 ATNT 님께
2020.11.19. 20:33

내년 2100 GPU성능은 기대해봐도 되는 부분인가요??

[후라이드치킨]님의 댓글을 신고합니다. 취소 신고
글쓴이
ATNT 후라이드치킨 님께
2020.11.19. 20:39

그거야 전 모르지요 ㅋㅋ

 

그런데 엑시노스 측에는 꽤 많은 페널티가 있는거 같네요.

 

1. 아무리 잘 나와도 게임사쪽에서 최적화 안해주면 결국 성능 말아먹는게 Mali 입니다.

2. DS사업부가 짜는 스케쥴러가 개판이고 IM사업부 측에서도 내부적으로 fps 제한을 빡세게 걸지요.

3.(과거형이지만) 게임이나 3D 구동시에도 결국 어느정도 CPU는 돌아가는데 M5의 전력효율은 A77의 절반입니다. 그래서 쓰로틀링이 더 빡세게 걸릴수밖에... Cortex-X1이면 그래도 TDP 측면에서 여유가 생기지 않을까 싶네요.

4. 7LPE는 멀쩡했지만 유독 7LPP에서 Speed Gain이 7FFP는 커녕 7FF 수준에 머물렀습니다. 5LPE도 잘 나와줘야 할텐데 걱정이네요. 퀄컴 돌아온걸 보면 이쪽으로는 그래도 좀 나아진거 같지만요.

 

저 4가지가 제대로 씨게 겹친게 990이었지요. 오죽하면 Peak 성능은 865랑 비슷해도 Sustained 성능은 9820이랑 노는... 오히려 9825가 쓰로틀링 덜 걸린걸 생각하면 적어도 게이밍용으로는 9825가 더 괜찮지 않을까 싶을 정도였지요.

[ATNT]님의 댓글을 신고합니다. 취소 신고
포인트봇
포인트봇 ATNT 님께
2020.11.19. 20:37
ATNT 님, 2포인트 채굴 성공!
[포인트봇]님의 댓글을 신고합니다. 취소 신고
후라이드치킨 후라이드치킨 님께
2020.11.19. 20:53

아 855플러스는 15%오버클럭이였군요.... 

[후라이드치킨]님의 댓글을 신고합니다. 취소 신고
후라이드치킨 ATNT 님께
2020.11.19. 20:59

정확한 지식을 알려주셔서 감사합니다~~^^

[후라이드치킨]님의 댓글을 신고합니다. 취소 신고
개구리
개구리 ATNT 님께
2020.11.19. 20:07

위키에 그런것도 나오나요? ㄷ

[개구리]님의 댓글을 신고합니다. 취소 신고
RuBisCO
RuBisCO
2020.11.19. 23:57

이론상의 FP16/FP32 성능이 실제 어플리케이션에서의 성능으로 이어지지 않는건 실제 게이밍 환경에선 필레이트가 굉장히 중요한 요소이기에 그렇습니다. 좀 극단적으로 가게되면 필레이트가 2배가 되면 쉐이더 성능이 절반 이하여도 필레이트가 높은쪽이 실제 게이밍 성능에선 압살하게 됩니다.

[RuBisCO]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 공지 사이트 이용 수칙 240809 수정 file admin 18.08.04 120166 13
핫글 미니 3년만에 기변이네요 [3] file 도저히못참겠다 24.09.28 871 15
핫글 미니 아이폰 16 프맥 원신 구동도 15 프맥보다 훨씬 개선되었다네요. [3] 요트맨 24.09.28 997 8
핫글 미니 갤워치 쓰면 쓸수록 진동이 너무 아쉽습니다 [8] HQteam 24.09.28 673 7
219429 미니 정말 AI가 모바일 디바이스와 완벽한 통합을 이룬다면 Terrapin 02:26 125 0
219428 미니 사파리 문제일까요 미코가 문제일까요 [4] woon 02:18 148 2
219427 미니 태블릿... 사용중인 인치수 투표 결과.jpg file Niflheimr 00:46 259 2
219426 미니 갤럭시가 나아가야 할 카메라 방향타 6 (Pixel 9Pro 50MP) [2] updatefile S.R 00:35 227 6
219425 미니 보통 Vulkan, Metal, DX12 성능 개선이 [4] file 흡혈귀왕 00:09 309 4
219424 미니 그래핀OS가 뭔가 싶어서 봤는데 [10] [성공]함께크는성장 24.09.28 715 6
219423 미니 갤펌)8gen4 전성비관련(스타레일) [8] file 알몬드오일 24.09.28 778 5
219422 미니 안드진영에선 metalFx같은 ai업스케일을 제공못하나요? [14] eg00 24.09.28 500 4
219421 미니 녹스 좀 없애주면 좋겠네요 [42] 스이공 24.09.28 1000 1
219420 미니 BOE가 소송서 지면 타격 크겠는데요 [7] 갠냑시 24.09.28 993 6
219419 미니 루머: 갤럭시 탭 S10 FE+ 감지 [16] Section31 24.09.28 896 2
219418 미니 안드탭 redmagic nova 디게좋네요? [3] updatefile LTE 24.09.28 553 5
219417 미니 삼성 SRA(MX), CPU 마이크로아키텍처 및 모델링 [14] file Aimyon 24.09.28 817 1
219416 미니 식사후 예쁜카페~ ft.지캠 file pietoro 24.09.28 222 2
219415 미니 아이폰 16 프맥 원신 구동도 15 프맥보다 훨씬 개선되었다네요. [3] 요트맨 24.09.28 997 8
219414 미니 mobox로 스냅드래곤 Gen3 에서 구동된 검은 신화 오공 [3] 흡혈귀왕 24.09.28 625 6
219413 미니 S24 FE 무게가 아쉽네요 [19] update 프로입털러 24.09.28 853 4
219412 미니 3년만에 기변이네요 [3] file 도저히못참겠다 24.09.28 871 15
219411 미니 갤럭시링 체험하고 왔슈 [4] 닉포토 24.09.28 541 1
219410 미니 oryon 코어 성과가 확실히 있긴 하네요. [4] file gamma 24.09.28 947 4
219409 미니 비보에서 새로운 기술의 BOE 디스플레이를 탑재한다네요 [1] file choijm0715 24.09.28 876 5
219408 미니 삼브 베타 27.0.0.63 [1] file [성공]함께크는성장 24.09.28 352 3
219407 미니 애플워치 보증기간 관련 질문드립니다 [3] file 쿼드쿼드 24.09.28 229 1
219406 미니 아이폰+갤워치 조합 의외로 좋네요 [3] 시엠 24.09.28 674 4
219405 미니 갤워치 쓰면 쓸수록 진동이 너무 아쉽습니다 [8] HQteam 24.09.28 673 7

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.