로그인 해주세요.

미니기기 / 음향 게시판 *스마트폰과 PC, 카메라, 스피커 등 IT 미니기기와 음향기기에 관해 교류하는 게시판입니다.

LaPL

미니 퀄컴이 발표하는 AI성능이 어떻게 계산되는걸까요?!?

  • LaPL
  • 조회 수 1294
  • 2023.08.17. 11:49

1.png

 

대표적으로 8(+) Gen 1 시리즈는 퀄컴이 AI engine에서 27 TOPS성능을 낸다고 광고중인 AP입니다. 아마 Gen1 까지는 가장 low bit의 datatype이 int8이니 int8기준 성능으로 추정됩니다. 

 

저 AI Engine은 CPU + GPU + Hexagon DSP를 모두 사용하는 퀄컴의 DNN 런타임 S/W로 다음과 같이 동작합니다. 

 

2.png

스냅드래곤 SoC내의 연산자원은 그림과 같이 CPU, GPU Hexagon DSP로 이루어져 있고. DPS중 연산을 담당하는 cDSP (Compute DSP)는 

 

3.png

64bit SIMD를 지원하는 Hexagon H/W thread와 128-byte SIMD를 지원하는 HVX유닛, 그리고 서드파티 개발자에게는 거의 공개되지 않은 HMX (Hexagon Matrix eXtension unit)으로 구성되어 있습니다. 8(+) gen1 시리즈의 v69 cDSP는 4개 H/W thread, 4개 HVX유닛이 탑재되어 있습니다. (boost clock 1.4Ghz, HMX는 정확한 제원 없음)

 

그래서.... 8 Gen1 기준 알려진 H/W의 이론상 최대 성능(Rpeak)은 다음과 같습니다. 

  1. CPU : 16 x 2 x 17.66Ghz [128b NEON SIMD * FMA * (3.0 MP1 + 2.5MP3 + 1.79MP4)] = 565 GIOPS
  2. GPU : 1024 ALU x 2 x 818Mhz = 1.675 TOPS(FP32, INT8), 3.35 TFLOPS (FP16)
  3. Hexagon DSP
    1. Hexagon H/W Thread : 8 x 2 x 1.4Ghz x 4 [64b SIMD * FMA * 1.4Ghz * MP4] = 89.6 GIOPS
    2. HVX : 128 x 2 x 1.4Ghz x 4 [128-byte SIMD * FMA * 1.4Ghz(추정) * MP4] = 1.433 TIOPS
    3. HMX : 알려진 H/W 제원 없음, 다만 cDSP SDK에서 제공하는 BLAS GEMM (행렬곱) 벤치마크 성능은 최대 1 TIOPS 내외 

 

다 더해도... 27 TOPS에 발끝에도 못 미치는 수치입니다 (...)

 

심지어 CPU에서 A510 리틀코어는 연산에 별 이득이 없으니 2배 정도 뻥튀기 된 값이고 (ARM의 자체 BLAS로 코드를 짜 봐도 리틀코어 들어가는 순간 성능이 하락, 멀티코어 동기화 문제로 성능 낮은 코어가 병목 발생)

 

Adreno 730 GPU의 경우에도 실수 ALU : 정수 ALU가 4 : 1구성으로 들어있어서 INT8보다 FP16이 더 빠릅니다. 

 

믿었던 Hexagon 마저 공개된 H/W제원으로든 퀄컴이 직접 공개하는 퍼스트파티 BLAS코드로든 성능이 수 TIOPS를 못 벗어나는 결과를 보니.... 대체가 저 27 TOPS는 어디서 나온 값 인지 모르겠습니다. 과장까지는 아니더라도 좀 수치를 올려치는 풍토가 SoC쪽에 만연되어 있는데 그래도 저정도 까지 차이나지는 않을텐데말이죠. 

 

아직 퀄컴이 NVIDIA다음으로 비메모리 펩리스 2위 업체일텐데.... 뭔가 하는 것은 있는데 외부로 공개되는건 별로 없고(...) 써 주겠다고 해도 이모양이니 힘드네요. 엔비디아 개발자 포럼에는 직원이 답해주고, AMD포럼에서는 개발자들끼리 소통은 되는 수준인데.... 퀄컴 개발자 포럼은 질문만 있고 답을 찾지 못하는 유령도시가 된 지 오래더군요. 

댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 공지 사이트 이용 수칙 230228 수정 file admin 18.08.04 117666 13
핫글 미니 효도폰 샀습니다 [7] file 북극곰플 24.07.29 752 19
핫글 미니 S24 6개월 누적 판매량 (전작대비 +12%) [7] file Stellist 24.07.29 880 15
핫글 미니 램12기가?아임헝그리 아직도배고프다. [5] S27울트라존버 24.07.29 579 11
197272 미니 엔트리 맥북 제일 만만한게 A14겠네요... [4] 흡혈귀왕 23.09.09 867 1
197271 미니 생태계가 이상하게 꼬였네요. [2] 룬룬 23.09.08 877 0
197270 미니 민팃 등급 미리 확인할 수 있나요? [7] 마물 23.09.08 487 0
197269 미니 잡담: 일명 "엔트리급 맥북"에 맞는 AP가 있다면...? [15] file Section31 23.09.08 1022 3
197268 미니 잡담: VMware가 하이퍼바이저를 지원하긴 하는데... [4] Section31 23.09.08 414 1
197267 미니 지금시기에 s8울트라는 어떤가요? [6] 슈뢰딩거 23.09.08 487 0
197266 미니 애플이벤트에서 괜히 기대되는것.. [3] 댕밤 23.09.08 688 2
197265 미니 잡담: 맥북에어 15를 사용한 지 두 달도 안 되었는데... [4] Section31 23.09.08 537 4
197264 미니 티플러스 ㅂㄷㅂㄷ,,, [2] file Pepsi베어 23.09.08 727 5
197263 미니 이것이 구글의 공대감성인가요? [2] file ZAMIBOYAK 23.09.08 1346 5
197262 미니 오... 낫싱2 투고... [9] file 후루꾸루 23.09.08 1066 10
197261 미니 잡담: 엑시노스 1000번대 AP들을 보니... [2] Section31 23.09.08 930 2
197260 미니 엑시노스2400 xclipse940 GPU는 루머대로라면... [33] 흡혈귀왕 23.09.08 2063 14
197259 미니 갤럭시 S10+에서 S23+로 바꾸고 난 뒤... [4] 만년휴학중 23.09.08 1223 5
197258 미니 안드 nPlayer는 거의 사기급이네요 [10] Chrop 23.09.08 2487 17
197257 미니 삼성파운드리 전성기는 10나노였죠 [13] 흡혈귀왕 23.09.08 1343 6
197256 미니 플스용 ssd 고민 [17] a1001 23.09.08 349 0
197255 미니 Z플립1 미러링.. [3] 웨이 23.09.08 564 0
197254 미니 삼성 모니터는 뭔가 애매하네요 [12] [성공]함께크는성장 23.09.08 732 1
197253 미니 화웨이보다 삼파가 더 신기합니다 [7] 윤이 23.09.08 1384 5
197252 미니 잡담: 갤럭시 A25 추정 긱벤치6 포착 [3] Section31 23.09.08 635 0
197251 미니 SK하이닉스 칩이 화웨이 스마트폰에서 발견 [9] 우주안녕 23.09.08 898 6
197250 미니 9000S는 모바일 AP에 SMT 도입에 대한 좋은 제시안이 되겠네요.. [10] 흡혈귀왕 23.09.08 569 0
197249 미니 중국 7나노의 관건은 [10] file Antares 23.09.08 891 1
197248 미니 15프맥 100달러 인상때문에 저장용량 128부터 시작한다는 루머가 있네요 [9] 댕밤 23.09.08 679 3

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...