AI 새로 발견한 엑시노스 의외의 단점

Eomjunsik
조회 수 621
2024.04.22. 12:59

termux 환경에서 llama.cpp를 이용한 llama 3 구동이 안되네요. ㅠㅠ

8gen2에서는 멀쩡히 되는 것을 보아 CLBlast와 엑시노스의 호환성 문제로 보입니다. 비주류 프로세서라는게 이런 곳에서 드러나는거겠죠.

8gen2에서 NPU 가속 없이 순수 GPU 성능, 그것도 오버헤드가 어마어마한 상태로도 llama 3 8B 4bit quantization 기준으로 3~4tps는 뽑네요. 이정도면 실제로 쓸만한 성능입니다.

iOS, macOS쪽은 확실히 API가 잘 갖춰져 있어서 MLX 가속을 이용하면 18tps도 뽑더군요. 안드로이드도 이런 API의 활용이 시급해 보입니다.

		7
				
1등BarryWhite
		2024.04.22. 13:02					
이런 시도가 가능한게 더 놀랍읍니다.

					[BarryWhite]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이Eomjunsik
						 BarryWhite 님께
				
		2024.04.22. 13:04					
아이폰은 지금 당장도 앱 하나 다운받아서 딸깍이면 끝나는데 말이죠.
 
안드 제조사-OS 제작사가 손발이 따로 노는게 참 아쉽긴 합니다.

					[Eomjunsik]님의 댓글을 신고합니다.
					취소
					신고
					
BarryWhite
						 Eomjunsik 님께
				
		2024.04.22. 13:04					
원래 딸-깍? 이었읍니까.
아숩네요.

					[BarryWhite]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이Eomjunsik
						 BarryWhite 님께
				
		2024.04.22. 13:18					
아이폰 13 Pro 이후 모델 갖고계시면 private llm이라는 앱 받으시면 끝입니다.

					 1
					
					[Eomjunsik]님의 댓글을 신고합니다.
					취소
					신고
					
2등흡혈귀왕
		2024.04.22. 13:02					
clvk 설치해도 동일한가용?

					[흡혈귀왕]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이Eomjunsik
						 흡혈귀왕 님께
				
		2024.04.22. 13:03					
clvk라는게 opencl을 vulkan으로 번역해주는거죠?
이론적으로는 llama.cpp가 vulkan 가속을 지원하기 때문에 가능할 것으로 보입니다만, 제가 clvk를 사용해본 경험이 없어서 테스트해보기는 어렵네요.

					[Eomjunsik]님의 댓글을 신고합니다.
					취소
					신고
					
흡혈귀왕
						 Eomjunsik 님께
				
		2024.04.22. 13:11					
vulkan으로도 가능하면
vulkan-loader-android 설치 후 시도해보실수도 있을거같습니다.

					[흡혈귀왕]님의 댓글을 신고합니다.
					취소
					신고

에디터로 글쓰기

번호	분류	제목	글쓴이	날짜		조회 수
공지	AI	AI / 로봇 게시판 이용 수칙 240418 [4]	admin	24.04.18	3	261
37	AI	AI가 도축 자동화를 가속화하고 있답니다. [9]	BarryWhite	24.05.02	8	778
36	AI	구글, AI 학습용 이미지 무단 사용으로 소송당해 [2]	BarryWhite	24.05.01	2	341
35	AI	심방세동 30분 전 예측하는 AI 개발	BarryWhite	24.04.30	0	172
34	AI	SKT: 텔코LLM 6월 개발 완료할 것	BarryWhite	24.04.30	0	169
33	AI	코파일럿 포 MS365 한국어 공식 지원	BarryWhite	24.04.30	1	204
32	AI	달리 그림-2- [1]	곰장수	24.04.28	7	278
31	AI	AI 활용 피 검사 연구, 암 식별도 가능 [2]	BarryWhite	24.04.25	0	146
30	AI	코카콜라-MS, AI 개발 5년 계약	BarryWhite	24.04.25	0	139
29	AI	애플, AI 모델 오픈ELM 시리즈 공개	BarryWhite	24.04.25	0	167
28	AI	어도비, 기반 모델 파이어플라이3 공개 [1]	BarryWhite	24.04.25	1	208
27	AI	구글·메타·MS, 아동 성학대 자료 AI 학습 제외	BarryWhite	24.04.24	0	95
26	AI	MS가 소형 AI 모델 파이3(Phi-3) 3종 공개했습니다.	BarryWhite	24.04.24	0	132
25	AI	구글, 안드로이드용 제미니 앱에 실시간 응답 방식 추가 예정?	BarryWhite	24.04.22	0	175
24	AI	아마존, AI 기반 전자책 증가	BarryWhite	24.04.22	0	111
23	AI	MS, 엔디비아 관계자 서울 모인다…국제 AI 표준 논의	BarryWhite	24.04.22	0	123
22	로봇	카카오모빌리티, 로봇 배송 서비스 브링 출시	BarryWhite	24.04.22	0	96
	AI	새로 발견한 엑시노스 의외의 단점 [7]	Eomjunsik	24.04.22	6	621
20	AI	美 유나이티드항공, AI 기술 활용 박차…운영 효율 향상	BarryWhite	24.04.22	0	99
19	AI	마크 저커버그: AI 학습 데이터 경쟁, 피드백 루프 가장 중요	BarryWhite	24.04.22	0	120
18	AI	틱톡, AI 음성 복제 기능 도입 전망 [4]	BarryWhite	24.04.21	1	238
17	AI	챗GPT 요즘 답변 진짜 성의없이 하고 없는 말을 지어내는군요. [5]	흡혈귀왕	24.04.20	7	947
16	AI	LA, AI를 노숙자 예측 및 지원하는데에 사용 중 [2]	BarryWhite	24.04.20	1	248
15	AI	구글, 딥마인드·리서치 팀 합병 발표	BarryWhite	24.04.20	0	191
14	AI	MS 워드 코파일럿, 빙 검색 결과 받아올 예정	BarryWhite	24.04.20	0	135
13	AI	어느새 눈 앞으로 다가온 온디바이스 LLM 시대 [9]	Eomjunsik	24.04.20	7	780

👨‍👩‍👧‍👦미코🌕

AI 새로 발견한 엑시노스 의외의 단점

추천 IT 소식 [1/]

스킨 기본정보

확장 변수

1. 게시판 기본 설정

2. 글 목록

3. 갤러리 설정

4. 글 읽기 화면

5. 댓글 설정

6. 글 쓰기 화면 설정