로그인 해주세요.

미니기기 / 음향 게시판 *스마트폰과 PC, 카메라, 스피커 등 IT 미니기기와 음향기기에 관해 교류하는 게시판입니다.

LaPL

미니 NPU라 하는 물건은....

  • LaPL
  • 조회 수 1555
  • 2021.01.13. 00:08

저도 배우는 입장에서 약간의 첨언을 (알쓸신잡 수준으로)드리면, NPU는 기존의 DSP,ISP랑 별 차이 없는 원리와 동작형태를 보여주고 있습니다. 

 

Ti의 DSP는 OpenCL을 동작할 정도로 범용성을 띄지만 본래 이런 회로들은 ASIC과 같이 특정 영역의 연산만을 전담해서 CPU의 부하를 줄이는 목적입니다. (즉 로직으로 찍어낸 연산만이 가능....)

 

NPU라고 거창하게 붙인건 해당 로직의 동작이 Ai....특히 Deep learning에서 주로 사용되는 곱셈 후 누산(FMA)연산에 특화되어있고 사용을 위한 API도 그러합니다. 

 

현재 코드상에서 NPU를 사용하는 대부분의 방법은, 외부 Deep Learning모델을 가져와서 추론시 부가 옵션으로 동작하게 구성되어있으며 다시 말하면 절대적으로 현재는 추론시에만 사용됩니다. 이는 다양한 Deep Learning 모델의 학습(Training)시 사용되는 복잡한 forward&backward path를 제한적인 회로에서 진행하기 힘들기에....

 

또한 대부분 현실적인 문제로 32비트 float가 아닌 float16이나 int8로 양자화(quantization)된 모델에서 동작하는것이 거의 강제됩니다. (Nvidia의 TensorRT나 구글의 TF-Lite)  이는 Deep Learning이 추론 단계에서는 대략적인 minimum근처에서 수렴하는 값 정도만 도출해도 어지간하면 쓸만한 결과가 나오기 때문인데....(data의 정밀도가 높을 필요가 없음) 그렇기에 태생부터 다른 연산에 써먹기 애매한 상황이죠. (Ai빼고 float16이나 int8을 써먹는 연산이 거의 없....)

 

지금은 NPU가 ARM AP들에 유행처럼 들어가는데(주로 저가인 Rockchip, Amlogic칩셋에도 들어가더군요....) 사실 사용처는 매우 제한되는 상황입니다(...) 범용으로 잘 쓰려면 API만드는 쪽에서 잘 해줘야 비벼라도 보는.... 

 

p.s 아래는 Nvidia의 Tegra Xavier에 들어간 NPU입니다. Xavier는 GPU+NPU(mp2-5TOPs/NPU)로 32TOPs라고 합니다.(8bit정수기준) 엑시 2100은 NPU혼자서 26TOPs는 충분히 높기는 합니다만, 기본적으로 ASIC과 같이 게이트를 직접하는 만큼 나오는 성능이라서 5nm가 좋기는 좋네요. 

feqLzpR.png

댓글
14
aleji
1등 aleji
2021.01.13. 00:09

일단 맞습니다

[aleji]님의 댓글을 신고합니다. 취소 신고
Havokrush
2등 Havokrush
2021.01.13. 00:09

비슷한 연산을 해도 별개의 프로세서 유닛이 있으면 분담되는 건 사실이죠.

[Havokrush]님의 댓글을 신고합니다. 취소 신고
보거
3등 보거
2021.01.13. 00:10

정보추!

[보거]님의 댓글을 신고합니다. 취소 신고
미니네임
미니네임
2021.01.13. 00:13

걍 엔당 텐사코어 rt코어 있드시 따로 처리하는부분 있는거

[미니네임]님의 댓글을 신고합니다. 취소 신고
LaPL
글쓴이
LaPL 미니네임 님께
2021.01.13. 00:19

차이가 있다면, 텐서 코어나 RT코어는 CPU의 SIMD명령과 비슷하게 한 번에 Vector형 데이터를 처리하는데 특화된 라인을 ALU에 묶어 GPU를 구성해서 CUDA나 OpenCL과 같은 방법으로 프로그래머가 성능향상을 위한 다른 코딩에 활용할 여지가 있다면, NPU는 AP제조사가 만들어둔 API외 다른 작업을 할당하기 거의 불가합니다. 

[LaPL]님의 댓글을 신고합니다. 취소 신고
Ent323
Ent323
2021.01.13. 00:16

NPU는 비교적 설계 난이도가 낮아서인지 DesignWare같은 범용IP에서도 기본적으로 제공해주더군요

[Ent323]님의 댓글을 신고합니다. 취소 신고
LaPL
글쓴이
LaPL Ent323 님께
2021.01.13. 00:21

사실 지금도 FPGA좀 만져봤다는 컴퓨터 랩이면 NPU만드는게 유행처럼 지나고 있습니다....

[LaPL]님의 댓글을 신고합니다. 취소 신고
Ent323
Ent323 LaPL 님께
2021.01.13. 00:25

MAC 로직자체는 되게 간단하니까요 ㅎ

[Ent323]님의 댓글을 신고합니다. 취소 신고
Alternative
Alternative
2021.01.13. 00:16

결국은 그걸 소프트웨어 단에서 어떤 작업에서 얼마나 잘 활용하느냐가 주가 되죠. 아직까진 (iOS도 그렇지만 특히 안드에서) 사용처가 극히 제한적이고요...

[Alternative]님의 댓글을 신고합니다. 취소 신고
포인트봇
포인트봇 Alternative 님께
2021.01.13. 00:16
Alternative 님, 1포인트 채굴 성공!
[포인트봇]님의 댓글을 신고합니다. 취소 신고
LaPL
글쓴이
LaPL Alternative 님께
2021.01.13. 00:26

그리고...이넘의 안드가 가상머신 기반이라서.....;;; 

iOS쪽은 애플이 API를 잘 짜주면 네이티브로 돌아갈 여지라도 있다면, 안드로이드는 필수적으로 NDK를 통한 JNI(Java Native Interface)사용이 강제됩니다. 경험상 한 번 Wrapping된 JNI를 콜 하는데 막대한 클럭 손실이 있어서.... 아무 생각 없이 쓰면 성능이 오히려 안 나오더군요(...)

[LaPL]님의 댓글을 신고합니다. 취소 신고
Aimyon
Aimyon
2021.01.13. 00:39

아 그래서 이런 걸 연구하는군요... 도움이 많이 됐습니다 선생님!

 

0701ondeviceai8.jpg

[Aimyon]님의 댓글을 신고합니다. 취소 신고
개구리
개구리
2021.01.13. 00:49

잘 설명해주셨군용👍🏻

[개구리]님의 댓글을 신고합니다. 취소 신고
콘칩
콘칩
2021.01.13. 08:54

요즘은 학부 수준에서도 npu 만들기를 관련 과목에서 프로젝트로 시킵니다

[콘칩]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 공지 사이트 이용 수칙 230228 수정 file admin 18.08.04 117750 13
핫글 미니 미출시 기기 3형제 [8] file Seol 24.08.06 811 14
핫글 미니 삿슈 폴드6 [1] file Minny 24.08.06 551 13
핫글 미니 초A급으로 보관중인 갤s8 인증이요. [9] updatefile niotree 24.08.06 699 10
206820 미니 지난 주말 애플 하남 대기줄... [15] file biller 23.12.11 1338 10
206819 미니 드디어 삼성 키보드 G Board화 시켰습니다. [7] file 레쓰비 23.12.11 1308 10
206818 미니 s20fe 보다가 s23fe 보면 조금 더 S입니다 [15] file 코드명다빈치 23.12.10 1444 10
206817 미니 제가 플래그십만 쓰는 이유. 특히 갤럭시 [10] file 오레오가좋아 23.12.09 1598 10
206816 미니 고민끝에 저질렀습니다... [2] file 레쓰비 23.12.09 935 10
206815 미니 유튜브 이렇게 확 올릴줄은 몰랐는데요 😫 [14] file MrGom™ 23.12.08 1170 10
206814 미니 근데 갤럭시가 티타늄을 적용할만한 명분이 있나요? [25] file 릅갈통 23.12.06 1620 10
206813 미니 펌) s23fe 시연폰 입고 [11] 요트맨 23.12.06 1662 10
206812 미니 이번 일로 통신사는 거위의 배를 찢었다는 거죠 [19] 딸기맛치킨 23.12.06 1542 10
206811 미니 삼성이 진짜 줬다가 뺏은 숨겨진 기능 하나 [15] file 겟아웃 23.12.04 2643 10
206810 미니 애플페이 카드사 루머가 하나 나오기는 하네요 [27] file 엔당이희망입니다 23.12.04 1954 10
206809 미니 워워 싸울 필요가 없습니다 [3] [성공]함께크는성장 23.12.03 886 10
206808 미니 최근 램 계획이 수정된게... [26] 흡혈귀왕 23.12.02 1983 10
206807 미니 최근 유럽판도 벤치가 뜸한거에 실마릴리온이 있을지 모르겠네요 [11] 흡혈귀왕 23.12.01 867 10
206806 미니 지금은 12기가램도 넉넉한 느낌은 아닌것 같습니다 [3] HQteam 23.11.30 752 10
206805 미니 one ui6에서 엑시노스2200 성능 올랐다는거 gamma 23.11.29 1277 10
206804 미니 컴퓨터 없이 ADB라니 세상 좋아졌네요 [5] file 두유 23.11.28 3474 10
206803 미니 S22 시리즈 one ui 6.0 공식 업데이트 릴리즈 [4] file 유비소프트 23.11.28 827 10
206802 미니 S21 울트라 섬 디자인이 제일 좋았습니다 [27] file 적당히하자 23.11.28 1124 10
206801 미니 S25 풀체인지 기념... 대륙 최신폰 후면 트렌드 따라잡기...jpg [16] file aleji 23.11.27 1742 10
206800 미니 밑에 아이폰 수리거부는 근거가 없지 않은 듯요 [21] file 미하엘무야허 23.11.27 1357 10
206799 미니 밑에 애플 수리 거부 건은 애플이 증명해야 하지 않나 싶네요 [성공]함께크는성장 23.11.27 612 10
206798 미니 새로 등록된 엑시노스2400 점수입니다 [35] file 나무김 23.11.26 2854 10
206797 미니 왠지 익숙한 느낌이었는데 [7] file 마키세크리스 23.11.25 651 10
206796 미니 S23 기본모델 긱벤치 멀티 5644점 [2] file 두꺼비감자칩 23.11.24 1440 10

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...