미니 온디바이스 AI를 보며 드는 궁금한 점..
- 새벽하늘
- 조회 수 718
- 2024.09.29. 12:47
같은 기능이 동일하게 지원되더라도
AP의 NPU 성능 우열에 따라서 도출되는 결과물의 질에 차이가 발생할 수도 있나용?
예를 들어 브라우징 어시스트로 사이트 내용을 AI 요약을 한다고 하면 S24보다 S23이 더 멍청하게(?) 요약한다거나...
생성형 사진 편집같은 서버로 내보내고 처리해서 갖고오는 결과물은 동일&비슷하겠지만
온디바이스로 처리하는 기능들은 결과물에도 차이가 발생하는지, 아니면 비슷한 결과물을 갖고오지만 처리속도에서만 차이가 발생하는건지 궁금합니다.
댓글
6
1등 감자
2등 THProject
3등 LaPL
글쓴이
새벽하늘
LaPL 님께
noop
글쓴이
새벽하늘
noop 님께
2024.09.29. 12:56
2024.09.29. 12:59
2024.09.29. 14:48
같은 파라미터, 같은 입력, 같은 랜덤시드라면 같은값이 나와야 합니다. 딥러닝이라고 해도 그 실체는 행렬곱 연산이라서, 값이 같은 두 행렬의 곱이 연산할 때 마다 다른 결과가 나온다는것은 말이 안되니까요.
다만 대부분 온디바이스에 들어가있는 모델은 서버에서 동작하는 모델보다 작은 파라미터가 들어있는 모델이기 때문에 파라미터가 다르고, 시스템이나 프레임워크마다 랜덤한 시드가 다르며, temperature라고 해서 같은 다른 모든 조건이 같을지라도 일부러 랜덤성을 추가해서 다양한 답변이 나오게 조정할 수도 있습니다.
또한 NPU를 사용한다면 (NPU 대부분이) 실수->정수로 양자화 (quantization)하는 과정이 추가되기 때문에 연산과정의 정밀도 차이로 인하여, 원래 실수로 연산했을때와 다른 결과가 나오는 경우가 있습니다.
2024.09.29. 15:01
2024.09.29. 14:49
2024.09.29. 15:05
같은 모델을 쓴다면 처리 속도의 차이가 있겠지만, 서버와 온디바이스는 다른 모델을 사용할 것 같습니다.