로그인 해주세요.

미니기기 / 음향 게시판 *스마트폰과 PC, 카메라, 스피커 등 IT 미니기기와 음향기기에 관해 교류하는 게시판입니다.

LaPL

미니 퀄컴이 발표하는 AI성능이 어떻게 계산되는걸까요?!?

  • LaPL
  • 조회 수 1305
  • 2023.08.17. 11:49

1.png

 

대표적으로 8(+) Gen 1 시리즈는 퀄컴이 AI engine에서 27 TOPS성능을 낸다고 광고중인 AP입니다. 아마 Gen1 까지는 가장 low bit의 datatype이 int8이니 int8기준 성능으로 추정됩니다. 

 

저 AI Engine은 CPU + GPU + Hexagon DSP를 모두 사용하는 퀄컴의 DNN 런타임 S/W로 다음과 같이 동작합니다. 

 

2.png

스냅드래곤 SoC내의 연산자원은 그림과 같이 CPU, GPU Hexagon DSP로 이루어져 있고. DPS중 연산을 담당하는 cDSP (Compute DSP)는 

 

3.png

64bit SIMD를 지원하는 Hexagon H/W thread와 128-byte SIMD를 지원하는 HVX유닛, 그리고 서드파티 개발자에게는 거의 공개되지 않은 HMX (Hexagon Matrix eXtension unit)으로 구성되어 있습니다. 8(+) gen1 시리즈의 v69 cDSP는 4개 H/W thread, 4개 HVX유닛이 탑재되어 있습니다. (boost clock 1.4Ghz, HMX는 정확한 제원 없음)

 

그래서.... 8 Gen1 기준 알려진 H/W의 이론상 최대 성능(Rpeak)은 다음과 같습니다. 

  1. CPU : 16 x 2 x 17.66Ghz [128b NEON SIMD * FMA * (3.0 MP1 + 2.5MP3 + 1.79MP4)] = 565 GIOPS
  2. GPU : 1024 ALU x 2 x 818Mhz = 1.675 TOPS(FP32, INT8), 3.35 TFLOPS (FP16)
  3. Hexagon DSP
    1. Hexagon H/W Thread : 8 x 2 x 1.4Ghz x 4 [64b SIMD * FMA * 1.4Ghz * MP4] = 89.6 GIOPS
    2. HVX : 128 x 2 x 1.4Ghz x 4 [128-byte SIMD * FMA * 1.4Ghz(추정) * MP4] = 1.433 TIOPS
    3. HMX : 알려진 H/W 제원 없음, 다만 cDSP SDK에서 제공하는 BLAS GEMM (행렬곱) 벤치마크 성능은 최대 1 TIOPS 내외 

 

다 더해도... 27 TOPS에 발끝에도 못 미치는 수치입니다 (...)

 

심지어 CPU에서 A510 리틀코어는 연산에 별 이득이 없으니 2배 정도 뻥튀기 된 값이고 (ARM의 자체 BLAS로 코드를 짜 봐도 리틀코어 들어가는 순간 성능이 하락, 멀티코어 동기화 문제로 성능 낮은 코어가 병목 발생)

 

Adreno 730 GPU의 경우에도 실수 ALU : 정수 ALU가 4 : 1구성으로 들어있어서 INT8보다 FP16이 더 빠릅니다. 

 

믿었던 Hexagon 마저 공개된 H/W제원으로든 퀄컴이 직접 공개하는 퍼스트파티 BLAS코드로든 성능이 수 TIOPS를 못 벗어나는 결과를 보니.... 대체가 저 27 TOPS는 어디서 나온 값 인지 모르겠습니다. 과장까지는 아니더라도 좀 수치를 올려치는 풍토가 SoC쪽에 만연되어 있는데 그래도 저정도 까지 차이나지는 않을텐데말이죠. 

 

아직 퀄컴이 NVIDIA다음으로 비메모리 펩리스 2위 업체일텐데.... 뭔가 하는 것은 있는데 외부로 공개되는건 별로 없고(...) 써 주겠다고 해도 이모양이니 힘드네요. 엔비디아 개발자 포럼에는 직원이 답해주고, AMD포럼에서는 개발자들끼리 소통은 되는 수준인데.... 퀄컴 개발자 포럼은 질문만 있고 답을 찾지 못하는 유령도시가 된 지 오래더군요. 

댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 공지 사이트 이용 수칙 240809 수정 file admin 18.08.04 117814 13
핫글 미니 얘네들이야말로 발전이 없네요ㅋㅋ [11] file Alternative 24.08.10 1794 23
핫글 미니 여러분 절대로 커스텀 키보드 하지 마세요 체질이란게 바뀝니다 [12] PatGelsinger 24.08.10 882 9
핫글 미니 6.1.1에 들어가는 전화 및 연락처앱 [5] file 감비아도나츠 24.08.10 750 8
107253 미니 발열이 배터리에 얼마나 영향을 주나요? [3] 미세먼지주의보 23.11.07 473 0
107252 미니 유튜브에서 드래그할 때마다 영상 정지되는 거 [3] file 참깨돌이 23.11.07 975 0
107251 미니 갤럭시 화면 모드 뭐쓰세요들? [14] 옆집남 23.11.06 778 0
107250 미니 잡담: 5개월 전 그렸던 디멘시티 9300 다이어그램 [1] file Section31 23.11.06 487 0
107249 미니 유무선 공유기 보다는, 유선공유기 + 무선AP 가 좀 더 나은것 같네요 [4] 금어초8gen3 23.11.06 438 0
107248 미니 잇섭 영상 새로 올라왔는데 [1] 룬룬 23.11.06 969 0
107247 미니 잡담: 디멘시티 9300 발표회 생중계 링크 Section31 23.11.06 173 0
107246 미니 홍미 시리즈에도 HyperOS 1.0 글로벌 롬 준비 중 [1] AlieNaTiZ 23.11.06 239 0
107245 미니 과연 23 Fe는 국내판은 안드 14로 출시할까 궁금해지네요 [12] 리사수믿어줘 23.11.06 552 0
107244 미니 램 체감 어느정도 되나요 [4] SOCOM 23.11.06 616 0
107243 미니 외장 SSD 속도가 안나오니 답답하네요 [6] 딸기맛치킨 23.11.06 366 0
107242 미니 글고보니 베타 1차 이후 없어진거 [5] 늅늅 23.11.06 662 0
107241 미니 긱벤치로 나온 스펙이랑 실기기랑 다른 적이 있었나요? [5] 애애앵 23.11.06 327 0
107240 미니 램 용량이 같으면 보통 아이폰이 갤럭시보다 좋은 편인가여? [20] 익명 23.11.06 1026 0
107239 미니 S22 정품 케이스 중에 [2] 룬룬 23.11.06 360 0
107238 미니 앱정리 해주는 sd maid SE 유료 구매할 만 한가요? [5] 엣지 23.11.06 655 0
107237 미니 삼성이 게임사랑 협력은 하고있었나요? [19] 나랏미 23.11.06 1201 0
107236 미니 요새 따라 유튜브 발열이 너무 심하네요 file moonjimin2013 23.11.06 528 0
107235 미니 요즘도 일부러 망가뜨려서 애케플 쓰는 사람 있나요? [5] 미세먼지주의보 23.11.05 913 0
107234 미니 보통 핸드폰 무게에 큰 영향을 주는 게 [12] 익명 23.11.05 791 0
107233 미니 아이폰과 안드폰의 성능 격차가 가장 심했던 게 21년이었나요? [13] 익명 23.11.05 1218 0
107232 미니 아이패드 12.9인치 어떻게 쓰시나요? [8] 코러스 23.11.05 566 0
107231 미니 아이폰 이 버그 있으신 분 없으신가요? [5] file 릅갈통 23.11.05 661 0
107230 미니 갤럭시탭s9플러스 구매했는데 이거 블루투스le 지원하는건가요? [2] 수리매 23.11.05 627 0
107229 미니 애플스토어나 공인 서비스센터에서 맥북 청소를 해줄까요? [3] 숨겨진오징어 23.11.05 1214 0

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...