로그인 해주세요.

미니기기 / 음향 게시판 *스마트폰과 PC, 카메라, 스피커 등 IT 미니기기와 음향기기에 관해 교류하는 게시판입니다.

LaPL

미니 퀄컴이 발표하는 AI성능이 어떻게 계산되는걸까요?!?

  • LaPL
  • 조회 수 1303
  • 2023.08.17. 11:49

1.png

 

대표적으로 8(+) Gen 1 시리즈는 퀄컴이 AI engine에서 27 TOPS성능을 낸다고 광고중인 AP입니다. 아마 Gen1 까지는 가장 low bit의 datatype이 int8이니 int8기준 성능으로 추정됩니다. 

 

저 AI Engine은 CPU + GPU + Hexagon DSP를 모두 사용하는 퀄컴의 DNN 런타임 S/W로 다음과 같이 동작합니다. 

 

2.png

스냅드래곤 SoC내의 연산자원은 그림과 같이 CPU, GPU Hexagon DSP로 이루어져 있고. DPS중 연산을 담당하는 cDSP (Compute DSP)는 

 

3.png

64bit SIMD를 지원하는 Hexagon H/W thread와 128-byte SIMD를 지원하는 HVX유닛, 그리고 서드파티 개발자에게는 거의 공개되지 않은 HMX (Hexagon Matrix eXtension unit)으로 구성되어 있습니다. 8(+) gen1 시리즈의 v69 cDSP는 4개 H/W thread, 4개 HVX유닛이 탑재되어 있습니다. (boost clock 1.4Ghz, HMX는 정확한 제원 없음)

 

그래서.... 8 Gen1 기준 알려진 H/W의 이론상 최대 성능(Rpeak)은 다음과 같습니다. 

  1. CPU : 16 x 2 x 17.66Ghz [128b NEON SIMD * FMA * (3.0 MP1 + 2.5MP3 + 1.79MP4)] = 565 GIOPS
  2. GPU : 1024 ALU x 2 x 818Mhz = 1.675 TOPS(FP32, INT8), 3.35 TFLOPS (FP16)
  3. Hexagon DSP
    1. Hexagon H/W Thread : 8 x 2 x 1.4Ghz x 4 [64b SIMD * FMA * 1.4Ghz * MP4] = 89.6 GIOPS
    2. HVX : 128 x 2 x 1.4Ghz x 4 [128-byte SIMD * FMA * 1.4Ghz(추정) * MP4] = 1.433 TIOPS
    3. HMX : 알려진 H/W 제원 없음, 다만 cDSP SDK에서 제공하는 BLAS GEMM (행렬곱) 벤치마크 성능은 최대 1 TIOPS 내외 

 

다 더해도... 27 TOPS에 발끝에도 못 미치는 수치입니다 (...)

 

심지어 CPU에서 A510 리틀코어는 연산에 별 이득이 없으니 2배 정도 뻥튀기 된 값이고 (ARM의 자체 BLAS로 코드를 짜 봐도 리틀코어 들어가는 순간 성능이 하락, 멀티코어 동기화 문제로 성능 낮은 코어가 병목 발생)

 

Adreno 730 GPU의 경우에도 실수 ALU : 정수 ALU가 4 : 1구성으로 들어있어서 INT8보다 FP16이 더 빠릅니다. 

 

믿었던 Hexagon 마저 공개된 H/W제원으로든 퀄컴이 직접 공개하는 퍼스트파티 BLAS코드로든 성능이 수 TIOPS를 못 벗어나는 결과를 보니.... 대체가 저 27 TOPS는 어디서 나온 값 인지 모르겠습니다. 과장까지는 아니더라도 좀 수치를 올려치는 풍토가 SoC쪽에 만연되어 있는데 그래도 저정도 까지 차이나지는 않을텐데말이죠. 

 

아직 퀄컴이 NVIDIA다음으로 비메모리 펩리스 2위 업체일텐데.... 뭔가 하는 것은 있는데 외부로 공개되는건 별로 없고(...) 써 주겠다고 해도 이모양이니 힘드네요. 엔비디아 개발자 포럼에는 직원이 답해주고, AMD포럼에서는 개발자들끼리 소통은 되는 수준인데.... 퀄컴 개발자 포럼은 질문만 있고 답을 찾지 못하는 유령도시가 된 지 오래더군요. 

댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 공지 사이트 이용 수칙 230228 수정 file admin 18.08.04 117744 13
핫글 미니 폴드쓰면서 살짝 짜친다고 느낄때 [15] file GalaxyZFold5 24.08.05 1198 16
핫글 미니 예의 없는 마이크로소프트 [11] updatefile 🤏tozoom 24.08.05 1486 15
핫글 미니 ??? : "어느 휴대전화에선 되고 안 되는 게 말이 안되지 않냐" [8] 스퀴니 24.08.05 1481 12
197403 미니 스위치2가 T239 맞다면... [11] 흡혈귀왕 23.09.12 907 3
197402 미니 스위치2 대박 좋네요? [9] BarryWhite 23.09.12 1578 12
197401 미니 A17부터 레이트레이싱 지원하는게 확실하나보네요 [11] 달에서사탕만드는토끼 23.09.12 802 1
197400 미니 삼성한테 이어폰 번들 기대가 안됩니다 [12] Qkooqq 23.09.12 867 4
197399 미니 스위치2는 T239가 맞나 보네요 [16] file Antares 23.09.12 1136 9
197398 미니 안 될 거 알지만 응모해봅미다 [4] file MrGom™ 23.09.12 609 9
197397 미니 아니면 버즈 FE를 기본 구성품으로 넣어주면 어떨까요? [6] propeller 23.09.12 446 0
197396 미니 아이폰12미니 사용자는 지금 심란합니다. [3] 아재건달_보노뭘보노 23.09.12 786 5
197395 미니 갤럭시탭 디스플레이 반사 아오 ... [5] file 품귀문란 23.09.12 904 4
197394 미니 갤럭시 버디2 폭발사고 났네요 ㄷㄷ [16] file IXAC 23.09.12 2031 2
197393 미니 플립5는 인기가 없는가요 [5] 아재건달_보노뭘보노 23.09.12 979 2
197392 미니 테슬라(전 삼성 M코어 아키텍트)에서 분석한 엑시노스, ARM, 애플 아키텍처 [3] file Aimyon 23.09.12 1195 5
197391 미니 아이폰15 시리즈보다 기다리는 것이 있습니다 [2] 에피 23.09.12 944 7
197390 미니 아이폰 사파리 애드가드 14프로는 되는데 11프로는 안되네요? [4] Jay65535 23.09.12 233 0
197389 미니 버즈 FE 출고가는 10정도에 나오겠죠 [7] Aimer 23.09.12 806 7
197388 미니 블라인드 게시물 익명 23.09.12 682 4
197387 미니 버즈FE 한 3만원 내외로 나오면 괜찮을거 같긴해요 (실구기준) [11] flair 23.09.11 880 2
197386 미니 잡담: 맥북에어 15 = 맥북프로 미니 (?) [1] Section31 23.09.11 476 4
197385 미니 잡담: 아사히 리눅스 환경에서의 긱벤치5 점수 [2] Section31 23.09.11 425 1
197384 미니 삼성노트가 갤북 한정으로 묶인 이상 [1] [성공]함께크는성장 23.09.11 539 0
197383 미니 잡담: 예전에는 스냅드래곤 845 및 855 디바이스에... [3] Section31 23.09.11 610 0
197382 미니 샤오미 12s 울트라 카메라 간단 분석 (댓글 내용 추가) [4] file RASBI 23.09.11 405 5
197381 미니 젠4c 들어간 apu 관련 정보들이 나오는군요 [3] file 인헤리턴스 23.09.11 465 1
197380 미니 샘성 노트 이제 갤북만 사용가능하네요 ㅜㅜ [7] 엘쥐오우너 23.09.11 756 2
197379 미니 저도 이번 아이폰은 패스입니다 [5] 아재건달_보노뭘보노 23.09.11 1005 3

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...