미니 NPU라 하는 물건은....

LaPL
조회 수 1556
2021.01.13. 00:08

저도 배우는 입장에서 약간의 첨언을 (알쓸신잡 수준으로)드리면, NPU는 기존의 DSP,ISP랑 별 차이 없는 원리와 동작형태를 보여주고 있습니다.

Ti의 DSP는 OpenCL을 동작할 정도로 범용성을 띄지만 본래 이런 회로들은 ASIC과 같이 특정 영역의 연산만을 전담해서 CPU의 부하를 줄이는 목적입니다. (즉 로직으로 찍어낸 연산만이 가능....)

NPU라고 거창하게 붙인건 해당 로직의 동작이 Ai....특히 Deep learning에서 주로 사용되는 곱셈 후 누산(FMA)연산에 특화되어있고 사용을 위한 API도 그러합니다.

현재 코드상에서 NPU를 사용하는 대부분의 방법은, 외부 Deep Learning모델을 가져와서 추론시 부가 옵션으로 동작하게 구성되어있으며 다시 말하면 절대적으로 현재는 추론시에만 사용됩니다. 이는 다양한 Deep Learning 모델의 학습(Training)시 사용되는 복잡한 forward&backward path를 제한적인 회로에서 진행하기 힘들기에....

또한 대부분 현실적인 문제로 32비트 float가 아닌 float16이나 int8로 양자화(quantization)된 모델에서 동작하는것이 거의 강제됩니다. (Nvidia의 TensorRT나 구글의 TF-Lite) 이는 Deep Learning이 추론 단계에서는 대략적인 minimum근처에서 수렴하는 값 정도만 도출해도 어지간하면 쓸만한 결과가 나오기 때문인데....(data의 정밀도가 높을 필요가 없음) 그렇기에 태생부터 다른 연산에 써먹기 애매한 상황이죠. (Ai빼고 float16이나 int8을 써먹는 연산이 거의 없....)

지금은 NPU가 ARM AP들에 유행처럼 들어가는데(주로 저가인 Rockchip, Amlogic칩셋에도 들어가더군요....) 사실 사용처는 매우 제한되는 상황입니다(...) 범용으로 잘 쓰려면 API만드는 쪽에서 잘 해줘야 비벼라도 보는....

p.s 아래는 Nvidia의 Tegra Xavier에 들어간 NPU입니다. Xavier는 GPU+NPU(mp2-5TOPs/NPU)로 32TOPs라고 합니다.(8bit정수기준) 엑시 2100은 NPU혼자서 26TOPs는 충분히 높기는 합니다만, 기본적으로 ASIC과 같이 게이트를 직접하는 만큼 나오는 성능이라서 5nm가 좋기는 좋네요.

		14
				
1등aleji
		2021.01.13. 00:09					
일단 맞습니다

					 1
					
					[aleji]님의 댓글을 신고합니다.
					취소
					신고
					
2등Havokrush
		2021.01.13. 00:09					
비슷한 연산을 해도 별개의 프로세서 유닛이 있으면 분담되는 건 사실이죠.

					 2
					
					[Havokrush]님의 댓글을 신고합니다.
					취소
					신고
					
3등보거
		2021.01.13. 00:10					
정보추!

					 1
					
					[보거]님의 댓글을 신고합니다.
					취소
					신고
					
미니네임
		2021.01.13. 00:13					
걍 엔당 텐사코어 rt코어 있드시 따로 처리하는부분 있는거

					[미니네임]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이LaPL
						 미니네임 님께
				
		2021.01.13. 00:19					
차이가 있다면, 텐서 코어나 RT코어는 CPU의 SIMD명령과 비슷하게 한 번에 Vector형 데이터를 처리하는데 특화된 라인을 ALU에 묶어 GPU를 구성해서 CUDA나 OpenCL과 같은 방법으로 프로그래머가 성능향상을 위한 다른 코딩에 활용할 여지가 있다면, NPU는 AP제조사가 만들어둔 API외 다른 작업을 할당하기 거의 불가합니다. 

					[LaPL]님의 댓글을 신고합니다.
					취소
					신고
					
Ent323
		2021.01.13. 00:16					
NPU는 비교적 설계 난이도가 낮아서인지 DesignWare같은 범용IP에서도 기본적으로 제공해주더군요

					[Ent323]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이LaPL
						 Ent323 님께
				
		2021.01.13. 00:21					
사실 지금도 FPGA좀 만져봤다는 컴퓨터 랩이면 NPU만드는게 유행처럼 지나고 있습니다....

					[LaPL]님의 댓글을 신고합니다.
					취소
					신고
					
Ent323
						 LaPL 님께
				
		2021.01.13. 00:25					
MAC 로직자체는 되게 간단하니까요 ㅎ

					[Ent323]님의 댓글을 신고합니다.
					취소
					신고
					
Alternative
		2021.01.13. 00:16					
결국은 그걸 소프트웨어 단에서 어떤 작업에서 얼마나 잘 활용하느냐가 주가 되죠. 아직까진 (iOS도 그렇지만 특히 안드에서) 사용처가 극히 제한적이고요...

					[Alternative]님의 댓글을 신고합니다.
					취소
					신고
					
포인트봇
						 Alternative 님께
				
		2021.01.13. 00:16					
Alternative 님, 1포인트 채굴 성공!

					[포인트봇]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이LaPL
						 Alternative 님께
				
		2021.01.13. 00:26					
그리고...이넘의 안드가 가상머신 기반이라서.....;;; 
iOS쪽은 애플이 API를 잘 짜주면 네이티브로 돌아갈 여지라도 있다면, 안드로이드는 필수적으로 NDK를 통한 JNI(Java Native Interface)사용이 강제됩니다. 경험상 한 번 Wrapping된 JNI를 콜 하는데 막대한 클럭 손실이 있어서.... 아무 생각 없이 쓰면 성능이 오히려 안 나오더군요(...)

					 1
					
					[LaPL]님의 댓글을 신고합니다.
					취소
					신고
					
Aimyon
		2021.01.13. 00:39					
아 그래서 이런 걸 연구하는군요... 도움이 많이 됐습니다 선생님!
 
					[Aimyon]님의 댓글을 신고합니다.
					취소
					신고
					
개구리
		2021.01.13. 00:49					
잘 설명해주셨군용👍🏻

					[개구리]님의 댓글을 신고합니다.
					취소
					신고
					
콘칩
		2021.01.13. 08:54					
요즘은 학부 수준에서도 npu 만들기를 관련 과목에서 프로젝트로 시킵니다

					[콘칩]님의 댓글을 신고합니다.
					취소
					신고

에디터로 글쓰기

번호	분류	제목	글쓴이	날짜	조회 수
공지	공지	사이트 이용 수칙 240809 수정	admin	18.08.04	120033	13
핫글	미니	3년만에 기변이네요 [3]	도저히못참겠다	15:17	605	13
핫글	미니	아이폰 16 프맥 원신 구동도 15 프맥보다 훨씬 개선되었다네요. [3]	요트맨	16:28	679	8
핫글	미니	아이폰16의 Wifi7도 반쪽짜리...군요... [11]	Stellist	09:47	1106	8
220810	미니	BOE가 소송서 지면 타격 크겠는데요	갠냑시	20:31	115	0
220809	미니	루머: 갤럭시 탭 S10 FE+ 감지 [14]	Section31	19:28	391	0
220808	미니	안드탭 redmagic nova 디게좋네요? [2]	LTE	18:03	317	2
220807	미니	삼성 SRA(MX), CPU 마이크로아키텍처 및 모델링 [14]	Aimyon	17:36	547	0
220806	미니	식사후 예쁜카페~ ft.지캠	pietoro	16:43	165	2
220805	미니	아이폰 16 프맥 원신 구동도 15 프맥보다 훨씬 개선되었다네요. [3]	요트맨	16:28	679	8
220804	미니	mobox로 스냅드래곤 Gen3 에서 구동된 검은 신화 오공 [3]	흡혈귀왕	16:12	477	6
220803	미니	S24 FE 무게가 아쉽네요 [18]	프로입털러	15:28	657	4
220802	미니	3년만에 기변이네요 [3]	도저히못참겠다	15:17	605	13
220801	미니	갤럭시링 체험하고 왔슈 [4]	닉포토	15:08	422	0
220800	미니	oryon 코어 성과가 확실히 있긴 하네요. [4]	gamma	14:19	784	4
220799	미니	비보에서 새로운 기술의 BOE 디스플레이를 탑재한다네요 [1]	choijm0715	13:49	695	5
220798	미니	삼브 베타 27.0.0.63 [1]	[성공]함께크는성장	13:37	293	3
220797	미니	애플워치 보증기간 관련 질문드립니다 [3]	쿼드쿼드	13:30	186	1
220796	미니	아이폰+갤워치 조합 의외로 좋네요 [2]	시엠	13:25	529	3
220795	미니	갤워치 쓰면 쓸수록 진동이 너무 아쉽습니다 [7]	HQteam	12:57	543	7
220794	미니	워치 울트라로 바꾸고 나니 샤오미가 웨어OS 4를 주는군요.. [6]	웽웽	11:50	664	2
220793	미니	파운드리적자 주력사업 메모리부진..? [7]	S27울트라존버	11:21	818	6
220792	미니	소식: 드디어 스냅드래곤 X 엘리트 다이샷이 나왔습니다. [4]	Section31	11:15	613	5
220791	미니	미친척 16프맥을 질렀는데 픽업을 할지말지 고민입니다 [13]	IRIVER	09:55	817	6
220790	미니	아이폰16의 Wifi7도 반쪽짜리...군요... [11]	Stellist	09:47	1106	8
220789	미니	애플워치 10주년 모델은 없는겁니까 [7]	북극곰플	09:13	496	1
220788	미니	대부도 길에서 바라본 송도	pietoro	06:18	422	3
220787	미니	갤럭시핏3에 유니버셜 제스처 있나요? [2]	엣지	05:02	334	0
220786	미니	라이카 Q3 43 국내 출시 [4]	BarryWhite	02:59	518	3

👨‍👩‍👧‍👦미코🌕

미니 NPU라 하는 물건은....

추천 IT 소식 [1/]

스킨 기본정보

확장 변수

1. 게시판 기본 설정

2. 글 목록

3. 갤러리 설정

4. 글 읽기 화면

5. 댓글 설정

6. 글 쓰기 화면 설정