로그인 해주세요.

미니기기 / 음향 게시판 *스마트폰과 PC, 카메라, 스피커 등 IT 미니기기와 음향기기에 관해 교류하는 게시판입니다.

LaPL

미니 퀄컴이 발표하는 AI성능이 어떻게 계산되는걸까요?!?

  • LaPL
  • 조회 수 1322
  • 2023.08.17. 11:49

1.png

 

대표적으로 8(+) Gen 1 시리즈는 퀄컴이 AI engine에서 27 TOPS성능을 낸다고 광고중인 AP입니다. 아마 Gen1 까지는 가장 low bit의 datatype이 int8이니 int8기준 성능으로 추정됩니다. 

 

저 AI Engine은 CPU + GPU + Hexagon DSP를 모두 사용하는 퀄컴의 DNN 런타임 S/W로 다음과 같이 동작합니다. 

 

2.png

스냅드래곤 SoC내의 연산자원은 그림과 같이 CPU, GPU Hexagon DSP로 이루어져 있고. DPS중 연산을 담당하는 cDSP (Compute DSP)는 

 

3.png

64bit SIMD를 지원하는 Hexagon H/W thread와 128-byte SIMD를 지원하는 HVX유닛, 그리고 서드파티 개발자에게는 거의 공개되지 않은 HMX (Hexagon Matrix eXtension unit)으로 구성되어 있습니다. 8(+) gen1 시리즈의 v69 cDSP는 4개 H/W thread, 4개 HVX유닛이 탑재되어 있습니다. (boost clock 1.4Ghz, HMX는 정확한 제원 없음)

 

그래서.... 8 Gen1 기준 알려진 H/W의 이론상 최대 성능(Rpeak)은 다음과 같습니다. 

  1. CPU : 16 x 2 x 17.66Ghz [128b NEON SIMD * FMA * (3.0 MP1 + 2.5MP3 + 1.79MP4)] = 565 GIOPS
  2. GPU : 1024 ALU x 2 x 818Mhz = 1.675 TOPS(FP32, INT8), 3.35 TFLOPS (FP16)
  3. Hexagon DSP
    1. Hexagon H/W Thread : 8 x 2 x 1.4Ghz x 4 [64b SIMD * FMA * 1.4Ghz * MP4] = 89.6 GIOPS
    2. HVX : 128 x 2 x 1.4Ghz x 4 [128-byte SIMD * FMA * 1.4Ghz(추정) * MP4] = 1.433 TIOPS
    3. HMX : 알려진 H/W 제원 없음, 다만 cDSP SDK에서 제공하는 BLAS GEMM (행렬곱) 벤치마크 성능은 최대 1 TIOPS 내외 

 

다 더해도... 27 TOPS에 발끝에도 못 미치는 수치입니다 (...)

 

심지어 CPU에서 A510 리틀코어는 연산에 별 이득이 없으니 2배 정도 뻥튀기 된 값이고 (ARM의 자체 BLAS로 코드를 짜 봐도 리틀코어 들어가는 순간 성능이 하락, 멀티코어 동기화 문제로 성능 낮은 코어가 병목 발생)

 

Adreno 730 GPU의 경우에도 실수 ALU : 정수 ALU가 4 : 1구성으로 들어있어서 INT8보다 FP16이 더 빠릅니다. 

 

믿었던 Hexagon 마저 공개된 H/W제원으로든 퀄컴이 직접 공개하는 퍼스트파티 BLAS코드로든 성능이 수 TIOPS를 못 벗어나는 결과를 보니.... 대체가 저 27 TOPS는 어디서 나온 값 인지 모르겠습니다. 과장까지는 아니더라도 좀 수치를 올려치는 풍토가 SoC쪽에 만연되어 있는데 그래도 저정도 까지 차이나지는 않을텐데말이죠. 

 

아직 퀄컴이 NVIDIA다음으로 비메모리 펩리스 2위 업체일텐데.... 뭔가 하는 것은 있는데 외부로 공개되는건 별로 없고(...) 써 주겠다고 해도 이모양이니 힘드네요. 엔비디아 개발자 포럼에는 직원이 답해주고, AMD포럼에서는 개발자들끼리 소통은 되는 수준인데.... 퀄컴 개발자 포럼은 질문만 있고 답을 찾지 못하는 유령도시가 된 지 오래더군요. 

댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 공지 사이트 이용 수칙 240809 수정 file admin 18.08.04 117923 13
핫글 미니 구글 엔지니어가 공개한 Zoom Enhanced 샘플 [13] file summer 08:24 1267 16
핫글 미니 이 아저씨 오랜만에 크게 설레발치네??? [9] updatefile 바보중 15:15 1024 10
핫글 음향 싸길래 여러 개 쌌습니다. [2] file AlieNaTiZ 02:27 1022 9
197826 미니 흐음 모델별 이원화가 사실이라면.... [7] soboru 23.09.15 481 0
197825 미니 일본정발 워치6 시리즈가 felica를 드디어 지원하네요 [5] file 리온 23.09.15 1058 1
197824 미니 글이 블라인드를 당햇군요 와르르혁명 23.09.15 568 0
197823 미니 S24도 살 건데 엑시2400 잘 나오면 좋겠습니다 Closers 23.09.15 285 1
197822 미니 사실 결과론적으로만 보면 [27] 흡혈귀왕 23.09.15 1993 7
197821 미니 갤럭시S23 시리즈 공시지원금이 50만원으로 올랐네요 당신말이맞습니다 23.09.15 399 0
197820 미니 2400이 그래도 gen2는 넉넉히 따겠죠? [13] Niflheimr 23.09.15 886 0
197819 미니 애플 환경 타령 쉴드치면 솔직히 개돼지죠 [7] 와르르혁명 23.09.15 578 10
197818 미니 램 2666 + 3200 혼용 되나요? [3] 이시우배찌 23.09.15 934 0
197817 미니 애플이랑 중국 제조사가 너무 안좋은 선례를 남겨버렸네요. [50] 흡혈귀왕 23.09.15 2466 6
197816 미니 닌텐도의 신형 콘솔 트레일러 발표시기 아마 10월쯤 아닐까요 [1] Qkooqq 23.09.15 378 0
197815 미니 5.5년전 추억팔이 by 갤s7 [10] file 고민은배송을늦출뿐 23.09.15 483 5
197814 미니 유니허츠 탱크는 어떤 폰인가요 [1] 와르르혁명 23.09.15 373 0
197813 미니 삼성 중급기가 칩셋이 아쉬운건 사실인데 [6] 아재건달_보노뭘보노 23.09.15 568 1
197812 미니 낫싱폰2가 가격이 생각보다 저렴했었네요? [5] file PaulBasset 23.09.15 537 5
197811 미니 “소시지나 끼워라” 갤럭시 조롱한 월 저널 칼럼니스트 근황 [26] file 크로아츠 23.09.15 2110 38
197810 미니 유그린에서 300w 충전기가 나왔군요? [1] file 달에서사탕만드는토끼 23.09.15 412 1
197809 미니 언리얼 엔진 : 우리는 100만달러까지 무료 [7] 딸기맛치킨 23.09.15 921 17
197808 미니 스위치2는 분명 깜짝 등장할거 같습니다 [2] 아재건달_보노뭘보노 23.09.15 473 1
197807 미니 잡담: 65W 충전 지원 루머는 거짓 [4] Section31 23.09.15 511 0
197806 미니 15프맥공.. 어찌 껍데기만 오셨소.. [2] file 회기동길냥이 23.09.15 859 10
197805 미니 A17 긱벤치6 GPU compute [4] file 좌지우건 23.09.15 797 2
197804 미니 서피스 듀오는 볼 때마다... [1] file MrGom™ 23.09.15 269 0
197803 미니 사실 뭐 엑시노스는 무작정 파운드리탓만 하기도 뭐한게.... [40] 흡혈귀왕 23.09.15 1628 13
197802 미니 Blackmagic Design에서 아이폰용 동영상 촬영 앱을 내놨네요 [3] 댕밤 23.09.15 420 4

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...