로그인 해주세요.

AI / 로봇 게시판 *AI / 로봇에 관해 교류하는 게시판입니다.

Eomjunsik

AI 새로 발견한 엑시노스 의외의 단점

Screenshot_20240422_124608_Termux.jpg

termux 환경에서 llama.cpp를 이용한 llama 3 구동이 안되네요. ㅠㅠ

 

8gen2에서는 멀쩡히 되는 것을 보아 CLBlast와 엑시노스의 호환성 문제로 보입니다. 비주류 프로세서라는게 이런 곳에서 드러나는거겠죠.

 

8gen2에서 NPU 가속 없이 순수 GPU 성능, 그것도 오버헤드가 어마어마한 상태로도 llama 3 8B 4bit quantization 기준으로 3~4tps는 뽑네요. 이정도면 실제로 쓸만한 성능입니다.

 

iOS, macOS쪽은 확실히 API가 잘 갖춰져 있어서 MLX 가속을 이용하면 18tps도 뽑더군요. 안드로이드도 이런 API의 활용이 시급해 보입니다.

Eomjunsik
📱 Samsung Galaxy S24 & Apple iPhone 14 Pro

📝 Samsung Galaxy Tab S9

💻 Apple MacBook Air M1

🖥️ Samsung S27A700

🎮 AMD R5 5600 + RX 6600

🎧 Sony WH-1000XM5 / Samsung Galaxy Buds Live

📖 Onyx Poke 5
댓글
7
BarryWhite
1등 BarryWhite
2024.04.22. 13:02

이런 시도가 가능한게 더 놀랍읍니다.

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
Eomjunsik
글쓴이
Eomjunsik BarryWhite 님께
2024.04.22. 13:04

아이폰은 지금 당장도 앱 하나 다운받아서 딸깍이면 끝나는데 말이죠.

 

안드 제조사-OS 제작사가 손발이 따로 노는게 참 아쉽긴 합니다.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
BarryWhite
BarryWhite Eomjunsik 님께
2024.04.22. 13:04

원래 딸-깍? 이었읍니까.

아숩네요.

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
Eomjunsik
글쓴이
Eomjunsik BarryWhite 님께
2024.04.22. 13:18

아이폰 13 Pro 이후 모델 갖고계시면 private llm이라는 앱 받으시면 끝입니다.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
흡혈귀왕
2등 흡혈귀왕
2024.04.22. 13:02

clvk 설치해도 동일한가용?

[흡혈귀왕]님의 댓글을 신고합니다. 취소 신고
Eomjunsik
글쓴이
Eomjunsik 흡혈귀왕 님께
2024.04.22. 13:03

clvk라는게 opencl을 vulkan으로 번역해주는거죠?

이론적으로는 llama.cpp가 vulkan 가속을 지원하기 때문에 가능할 것으로 보입니다만, 제가 clvk를 사용해본 경험이 없어서 테스트해보기는 어렵네요.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
흡혈귀왕
흡혈귀왕 Eomjunsik 님께
2024.04.22. 13:11

vulkan으로도 가능하면

vulkan-loader-android 설치 후 시도해보실수도 있을거같습니다.

[흡혈귀왕]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 AI AI / 로봇 게시판 이용 수칙 240418 [4] admin 24.04.18 3 166
28 AI 어도비, 기반 모델 파이어플라이3 공개 [1] BarryWhite 24.04.25 1 190
27 AI 구글·메타·MS, 아동 성학대 자료 AI 학습 제외 BarryWhite 24.04.24 0 78
26 AI MS가 소형 AI 모델 파이3(Phi-3) 3종 공개했습니다. BarryWhite 24.04.24 0 116
25 AI 구글, 안드로이드용 제미니 앱에 실시간 응답 방식 추가 예정? file BarryWhite 24.04.22 0 160
24 AI 아마존, AI 기반 전자책 증가 BarryWhite 24.04.22 0 99
23 AI MS, 엔디비아 관계자 서울 모인다…국제 AI 표준 논의 BarryWhite 24.04.22 0 111
22 로봇 카카오모빌리티, 로봇 배송 서비스 브링 출시 BarryWhite 24.04.22 0 79
AI 새로 발견한 엑시노스 의외의 단점 [7] file Eomjunsik 24.04.22 6 586
20 AI 美 유나이티드항공, AI 기술 활용 박차…운영 효율 향상 BarryWhite 24.04.22 0 82
19 AI 마크 저커버그: AI 학습 데이터 경쟁, 피드백 루프 가장 중요 BarryWhite 24.04.22 0 102
18 AI 틱톡, AI 음성 복제 기능 도입 전망 [4] file BarryWhite 24.04.21 1 225
17 AI 챗GPT 요즘 답변 진짜 성의없이 하고 없는 말을 지어내는군요. [5] 흡혈귀왕 24.04.20 7 902
16 AI LA, AI를 노숙자 예측 및 지원하는데에 사용 중 [2] BarryWhite 24.04.20 1 237
15 AI 구글, 딥마인드·리서치 팀 합병 발표 BarryWhite 24.04.20 0 170
14 AI MS 워드 코파일럿, 빙 검색 결과 받아올 예정 file BarryWhite 24.04.20 0 119
13 AI 어느새 눈 앞으로 다가온 온디바이스 LLM 시대 [9] file Eomjunsik 24.04.20 7 712
12 AI 국내 기업 로봇이 미 플로리다 주거단지 순찰 file BarryWhite 24.04.19 1 168
11 AI 스태빌리티가 직원을 10% 가량 해고했다고 합니다. [3] BarryWhite 24.04.19 0 314
10 AI MS, 얼굴 사진만으로 노래하게 만드는 AI 프레임워크 VASA-1 공개 file BarryWhite 24.04.19 0 132
9 AI 메타, LLM 라마3 모델 공개 [1] sourire 24.04.19 2 209
8 AI 레인보우 로보틱스 펄럭펄럭 24.04.18 0 220
7 AI 휴마타 AI 리뷰: 기능, 성능, 가격에 대한 자세한 분석 BarryWhite 24.04.18 0 135
6 로봇 보스턴 다이나믹스, 올 뉴 아틀라스 공개 [4] BarryWhite 24.04.18 4 332
5 AI Stability AI, 스테이블 디퓨전3 API 출시...DALL-E 및 미드저니 보다 뛰어나 BarryWhite 24.04.18 1 176
4 AI 문샷 팩토리, AI 재해 예측 프로젝트 벨웨더 공개 file BarryWhite 24.04.18 1 72

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...