로그인 해주세요.

미니기기 / 음향 게시판 *스마트폰과 PC, 카메라, 스피커 등 IT 미니기기와 음향기기에 관해 교류하는 게시판입니다.

LaPL

미니 퀄컴이 발표하는 AI성능이 어떻게 계산되는걸까요?!?

  • LaPL
  • 조회 수 1208
  • 2023.08.17. 11:49

1.png

 

대표적으로 8(+) Gen 1 시리즈는 퀄컴이 AI engine에서 27 TOPS성능을 낸다고 광고중인 AP입니다. 아마 Gen1 까지는 가장 low bit의 datatype이 int8이니 int8기준 성능으로 추정됩니다. 

 

저 AI Engine은 CPU + GPU + Hexagon DSP를 모두 사용하는 퀄컴의 DNN 런타임 S/W로 다음과 같이 동작합니다. 

 

2.png

스냅드래곤 SoC내의 연산자원은 그림과 같이 CPU, GPU Hexagon DSP로 이루어져 있고. DPS중 연산을 담당하는 cDSP (Compute DSP)는 

 

3.png

64bit SIMD를 지원하는 Hexagon H/W thread와 128-byte SIMD를 지원하는 HVX유닛, 그리고 서드파티 개발자에게는 거의 공개되지 않은 HMX (Hexagon Matrix eXtension unit)으로 구성되어 있습니다. 8(+) gen1 시리즈의 v69 cDSP는 4개 H/W thread, 4개 HVX유닛이 탑재되어 있습니다. (boost clock 1.4Ghz, HMX는 정확한 제원 없음)

 

그래서.... 8 Gen1 기준 알려진 H/W의 이론상 최대 성능(Rpeak)은 다음과 같습니다. 

  1. CPU : 16 x 2 x 17.66Ghz [128b NEON SIMD * FMA * (3.0 MP1 + 2.5MP3 + 1.79MP4)] = 565 GIOPS
  2. GPU : 1024 ALU x 2 x 818Mhz = 1.675 TOPS(FP32, INT8), 3.35 TFLOPS (FP16)
  3. Hexagon DSP
    1. Hexagon H/W Thread : 8 x 2 x 1.4Ghz x 4 [64b SIMD * FMA * 1.4Ghz * MP4] = 89.6 GIOPS
    2. HVX : 128 x 2 x 1.4Ghz x 4 [128-byte SIMD * FMA * 1.4Ghz(추정) * MP4] = 1.433 TIOPS
    3. HMX : 알려진 H/W 제원 없음, 다만 cDSP SDK에서 제공하는 BLAS GEMM (행렬곱) 벤치마크 성능은 최대 1 TIOPS 내외 

 

다 더해도... 27 TOPS에 발끝에도 못 미치는 수치입니다 (...)

 

심지어 CPU에서 A510 리틀코어는 연산에 별 이득이 없으니 2배 정도 뻥튀기 된 값이고 (ARM의 자체 BLAS로 코드를 짜 봐도 리틀코어 들어가는 순간 성능이 하락, 멀티코어 동기화 문제로 성능 낮은 코어가 병목 발생)

 

Adreno 730 GPU의 경우에도 실수 ALU : 정수 ALU가 4 : 1구성으로 들어있어서 INT8보다 FP16이 더 빠릅니다. 

 

믿었던 Hexagon 마저 공개된 H/W제원으로든 퀄컴이 직접 공개하는 퍼스트파티 BLAS코드로든 성능이 수 TIOPS를 못 벗어나는 결과를 보니.... 대체가 저 27 TOPS는 어디서 나온 값 인지 모르겠습니다. 과장까지는 아니더라도 좀 수치를 올려치는 풍토가 SoC쪽에 만연되어 있는데 그래도 저정도 까지 차이나지는 않을텐데말이죠. 

 

아직 퀄컴이 NVIDIA다음으로 비메모리 펩리스 2위 업체일텐데.... 뭔가 하는 것은 있는데 외부로 공개되는건 별로 없고(...) 써 주겠다고 해도 이모양이니 힘드네요. 엔비디아 개발자 포럼에는 직원이 답해주고, AMD포럼에서는 개발자들끼리 소통은 되는 수준인데.... 퀄컴 개발자 포럼은 질문만 있고 답을 찾지 못하는 유령도시가 된 지 오래더군요. 

댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 공지 사이트 이용 수칙 230228 수정 file admin 18.08.04 116322 13
핫글 미니 소비자가 기업에 맞춰줄 필요 없는것 맞죠 [28] 가로쓰기 00:27 867 28
핫글 미니 삼성 편의적인 시각이 있는건 아무래도 [1] SM-G986N 04:41 588 17
핫글 미니 이번 란즈크 블로그 글보니깐 [9] 흡혈귀왕 24.06.21 1877 15
192494 미니 엑시노스가 탑재된 전제하에 S24 시리즈 카메라 루트는 두가지일겁니다. [21] 흡혈귀왕 23.02.23 1149 4
192493 미니 지마켓 S23 할인율 12%입니다 [4] file Chrop 23.02.06 1149 7
192492 미니 삼성 4분기는 멸망 그 자체군여 [17] 찌그렁오리 23.01.06 1149 5
192491 미니 아니 아이패드10세대 색깔 왜이러나요??? [7] file 비둘기야먹자 22.10.28 1149 3
192490 미니 라인 한번 써보니 한국쪽 서비스 방치한게 느껴지긴 합니다 [29] Chrop 22.10.16 1149 3
192489 미니 갤럭시s는 시대역행 입니다.. [19] 윤이 22.09.27 1149 6
192488 미니 의외로 애플에 늦게 도입된 기능 [13] file Alternative 22.09.10 1149 0
192487 미니 그런데말입니다,, 다이나믹 아일랜드 보다보니까,, [10] file 개구리 22.09.09 1149 2
192486 미니 루머대로라면 갤워치5는 여전히 애플워치대비 가성비 제품이네요. [9] Stellist 22.08.05 1149 5
192485 미니 삼성전자, ΄보이스피싱 악용 앱΄ 차단 …보안 솔루션 공개 [1] Railgun 22.05.18 1149 1
192484 미니 삼성 이직썰 보니까 떠오르는데 [8] SM-G986N 22.04.18 1149 5
192483 미니 스마트폰에 팬을 달면 이렇게 됩니다. [6] file AquStar 22.03.24 1149 7
192482 미니 S22 진동모터 확실히 좋아지긴했네요 [5] 멜로엘로 22.02.12 1149 6
192481 미니 S21U vs S22U 야간 비됴 디테일 차이 [11] file 흡혈귀왕 22.02.11 1149 14
192480 미니 일본은 아직 가수마케팅을 하네요. [13] 서녘마리 21.12.13 1149 4
192479 미니 SK BTV + 애플TV 조합은 한동안 쓰면 안될거같네요 [4] 스퀴니 21.12.11 1149 2
192478 미니 Exynos 2200은 2100보다 30% 더 높은 피크, 20% 더 높은 지속 성능을 갖습니다. [7] aleji 21.11.13 1149 1
192477 미니 발열 패치 덕분에 희망이 생겼습니다 [4] sourire 21.06.17 1149 6
192476 미니 갤북 프로 상당히 휘네요 [14] file 선라이즈 21.05.11 1149 9
192475 미니 갤럭시 북 프로 360 분해 영상에 나온 SSD인데 [3] file Rx-Tx 21.04.29 1149 1
192474 미니 섹시노스 / 두번째 결과 대공개 [15] file ㄹㅇㅋㅋ 21.01.19 1149 10
192473 미니 애플이 실버가지고 배신할줄은.. [9] file 루딱이 21.01.10 1149 7
192472 미니 S21U S펜 확정 [10] file Thomasp5675 20.12.23 1149 4
192471 미니 S21 Ultra OnLeaks 렌더링 업데이트 [14] file Thomasp5675 20.10.30 1149 0
192470 미니 나오기도 전에 명예로운 죽음 [6] file 한강가는주린이 20.08.08 1149 0

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...