
미니 NPU, 또는 온디바이스AI는 힘들거 같습니다.
- 윤이
- 조회 수 1070
- 2025.06.17. 07:52
적어도 당장은 온디바이스 AI는 쓸모 없는거 같습니다.
튜닝 되어있는 온라인 AI 서비스들을 이길 수 없습니다.
쓸모없는 NPU보다 6G?로 초저지연 초고대역폭 연결이 더 현실적인거 같습니다.
완벽하게 개인화면 온디바이스 AI.. 물리적으로 용량과 필요 성능을 생각해보면 아무리봐도 당장은 가능할까 싶습니다.
특히 여려 기기에서의 개인화된 경험을 생각 해보면 결국 클라우드를 한번 거쳐야 하는데 그럴거면 기기내장이 더더욱..
마치 유투브 같은거라 생각합니다. 굳이 저장 해놔야 하는가의 문제 랄까요?
하여간 요새 하다하다 피시 칩들까지 NPU타령 하는거 보고 모래낭비다 라는 생각을 하다가 든 생각입니다.
댓글
8
best 1등 Minny
best 2등 콜홍
Minny
콜홍 님께
3등 ngooooon
바른말고운말
whale
클래식크롬
demi
2025.06.17. 07:59

2025.06.17. 08:07
2025.06.17. 09:13
아침에 멍한 기운으로 하고싶은 말을 다 못썼는데, 대신 적어주셔서 감사합니다.
사실 일반 사용자 입장에서 NPU를 쓸만한 프로그램, 기능들이 없는 편이긴 한데, 점점 유용한 기능들로 채워지고 있는 상황이죠. LLM은 너무 거창한거고, 엣지 AI라는 이름 아래에 쓰이는 기술들이 많아지기에 NPU 라는게 점점 보급되는거라고 이해하시면 될 것 같습니다.
저는 요즘 통화녹음이나 회의 녹음한거 바로바로 텍스트로 보는게 정말 편한데 이게 NPU 없으면 한세월 걸릴 일이었다고 생각하면 아찔합니다 ㅎㅎ 물론 품질이 훌륭하다고는 말 못하지만, 그렇기 때문에 오히려 NPU 성능이 더 발전했으면 좋겠습니다.

2025.06.17. 08:07

2025.06.17. 08:42
2025.06.17. 13:14

2025.06.17. 17:00

2025.06.18. 12:09
아닙니다. 의외로 엣지 AI 는 필요합니다.
실시간 처리가 필요하고, 과거에 CPU랑 GPU가 버겁게 처리했던 그런 영역을 NPU가 도입되면서 이관시켰고, 그덕분에 쾌적해진게 몇개 있는데, 대표적으로 화상회의 내 영상처리나, STT 처리가 있고요.
초저지연을 실현하기 위한 전파 처리 같은 것 보다 차라리 엣지 AI를 활성화 하는게 사실 더 간편하기도 하구요. (5G 초저지연도 이미 글러먹었고, 6G는 애초에 컨셉이 다르구요)
어떤 예시를 더 들어야 할까 당장은 생각이 나지 않는데, 단순 LLM 처리 뿐만 아니라 다양한 용도로 NPU를 쓸 수 있기 때문에 들어가는건 중요합니다.