로그인 해주세요.

AI / 로봇 게시판 *AI / 로봇에 관해 교류하는 게시판입니다.

Eomjunsik

AI 어느새 눈 앞으로 다가온 온디바이스 LLM 시대

어제 공개된 Meta의 Llama 3는 8B, 70B 두개의 종류가 선공개 되었습니다.

여기서 주목하셔야 하는 것은 8B 모델의 성능입니다.

Screenshot 2024-04-20 at 00.32.24.png현존하는 LLM 평가 방식 중 그나마 체감에 가깝다고 여겨지는 LLM Arena 결과입니다. 아직 초기 결과에 불과하지만 instuction-tuned 버전의 Llama 3 8B가 Gemini Pro, Claude 2.1, GPT 3.5를 모두 능가하는 성능을 보여줍니다.

 

이것이 큰 의미를 갖는 이유는

 

1. Meta가 공개하는 Instruction-tuned 버전은 기초적인 fine-tuning만 된 것으로 아직도 성능 향상의 여지가 큼.

2. 이 모델이 이미 능가하는 GPT 3.5는 사용자가 불편함을 느끼지 않을 수 있는 LLM 성능의 마지노선임.

2. 8B는 8bit 양자화 기준 8GB, 4bit 양자화 기준 4GB의 램을 요구하기 때문에 On-device 구현의 마지노선 사이즈임.

 

위와 같습니다. 즉 성능, 용량적인 면에서 On-device LLM 구현의 9부 능선을 넘었다는거죠. 메타가 이번에 8B 버전의 성능 향상에 특히 노력한 것도 다분히 의도적으로 보이구요.

 

현실적으로 현재의 Galaxy AI와 같이 대부분의 처리를 서버에 의존하는 방법은 지속 가능하지 않습니다. 삼성이 부담해야 하는 서버비 or 로열티적인 면에서도 그렇구요. 사용자 경험 측면에서도 일단 데이터 사용량과 레이턴시를 무시할 수 없으니까요.

 

결국 나아가야 하는 방향은 구글과 애플이 누구보다 잘 알고 있듯이 On-device 탑재입니다. AI 기능을 사용할 때마다 램에 몇기가씩 로드할수는 없으니 상시 로딩해 놓는것에 가깝게 준비해야겠죠. 즉, 내년부터 공개될 진정한 AI 스마트폰의 램은 최소 4GB는 빼고 보셔야 할겁니다. 12GB면 8+4GB 이런 느낌인거죠.

 

온디바이스로 항상 나를 위해 준비된 GPT 3.5라니, 생각만 해도 너무 좋습니다. 이와중에 S25는 여전히 8GB Variant가 존재한다는 소문이 있던데.. 제정신인가 싶습니다. 8GB 모델은 One UI 8 업뎃시 AI 기능 제외, 이런 헤드라인 감당할 수 있나요?





+추가) 에이, 이 사람 또 호들갑떠네. 이런 생각이 드신다면 바로 사용해보시길 권합니다.


https://llama3.replicate.dev/

여기서 8B 고르시면 바로 써보실 수 있습니다. 깜짝 놀라실걸요.

Eomjunsik
📱 Samsung Galaxy S24 & Apple iPhone 14 Pro

📝 Samsung Galaxy Tab S9

💻 Apple MacBook Air M1

🖥️ Samsung S27A700

🎮 AMD R5 5600 + RX 6600

🎧 Sony WH-1000XM5 / Samsung Galaxy Buds Live

📖 Onyx Poke 5
댓글
9
Eomjunsik
글쓴이
Eomjunsik S24울트라존버 님께
2024.04.20. 00:49

정신나간 짓 3대장 중 라이트닝은 이제 가셨고

노멀 8GB와 노멀 60Hz만 남았네요.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
구보
2등 구보
2024.04.20. 00:48

제 예측으로는 갤럭시에 본문에서 언급하신 형태의 온디바이스 AI가 나오면 기본형 8GB가 존재하는 세대는 램이 넉넉해도 같이 컷 당할거 같아요.. 아니면 울트라만 해주거나? 

[구보]님의 댓글을 신고합니다. 취소 신고
Eomjunsik
글쓴이
Eomjunsik 구보 님께
2024.04.20. 00:49

아직은 불행회로에 불과하지만.. 현실화되지 않기만을 바랍니다.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
BarryWhite
3등 BarryWhite
2024.04.20. 00:49

이미 모바일 디램이 24GB 32GB가 나온 걸루 아는데

아직도 8/12GB라는 게 참 아쉽읍니다.

삼성이나 애플이나 얼른 램을 올려줬으면 좋겠네요.

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
Eomjunsik
글쓴이
Eomjunsik BarryWhite 님께
2024.04.20. 00:50

램 가격이 역대 최저가를 찍을때도 안올려준 놈들이 지금 올려줄까 싶긴 합니다.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
BarryWhite
BarryWhite Eomjunsik 님께
2024.04.20. 00:53

"램 공급이 많아져서 가격이 떨어지면 분명 램을 늘려줄겁니다"

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
성능확실
성능확실
2024.04.20. 01:35

IMG_1271.png

 

아이폰15프로로 llama2 7b 모델을 온디바이스로 돌려서 써보고 있는데 응답속도는 꽤 빠르긴 한데 램을 엄청나게 잡아먹는지 이것만 켜면 다른 앱들이 약간씩 버벅이더라구요. 아이폰,갤럭시 둘 다 llm을 제대로 쓰려면 램 용량을 확 늘려줘야 할 것 같습니다🥲

[성능확실]님의 댓글을 신고합니다. 취소 신고
sjkoon
sjkoon
2024.04.20. 07:51

결국 온디바이스AI 는 램이 관건이네요. 애플로서는 고심이 깊어질거 같군요..

[sjkoon]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 AI AI / 로봇 게시판 이용 수칙 240418 [4] admin 24.04.18 3 191
134 AI 시리에 탑재되는게 GPT-4o일 것 같습니다 [13] Alternative 24.05.14 14 903
133 AI 원래 gpt는 수학 계산에 약하다고 들었는데 [8] 미세먼지주의보 24.05.18 9 558
132 AI AI가 도축 자동화를 가속화하고 있답니다. [9] BarryWhite 24.05.02 8 770
131 AI 달리 그림-2- [1] file 곰장수 24.04.28 7 267
AI 어느새 눈 앞으로 다가온 온디바이스 LLM 시대 [9] file Eomjunsik 24.04.20 7 742
129 AI 챗GPT 요즘 답변 진짜 성의없이 하고 없는 말을 지어내는군요. [5] 흡혈귀왕 24.04.20 7 926
128 AI GPT-4o 한국어 성능이 괜찮긴 하네요 [16] Alternative 24.05.31 6 657
127 AI 새로 발견한 엑시노스 의외의 단점 [7] file Eomjunsik 24.04.22 6 605
126 AI Cladue 좋네요 [7] file 룬룬 24.05.20 6 444
125 AI 중국 시진핑 사상 기반 중국형 AI 모델 개발 중 [11] BarryWhite 24.05.23 6 463
124 AI 한국인 암호 뚫렸다네요 [6] file 비둘기야먹자 24.05.28 5 991
123 AI 거짓말하는 ai 발견 [2] file 펄럭펄럭 24.05.15 5 381
122 AI 그림쟁이 다 죽는다...싶은 AI 모델 등장 file BarryWhite 24.05.02 5 468
121 AI GPT-4o 빨리 핸즈온 해보고 싶네요. [6] Alternative 24.05.14 5 419
120 AI 오픈AI, AI 성인 콘텐츠 제작 허용 검토 중 [5] BarryWhite 24.05.10 5 637
119 AI 2D 이미지 3D로 변환해주는 앱 돌리 file BarryWhite 24.05.28 5 183
118 로봇 보스턴 다이나믹스, 올 뉴 아틀라스 공개 [4] BarryWhite 24.04.18 4 343
117 AI 스태빌리티AI 매각 추진중이라고 하네요? BarryWhite 24.05.16 4 175
116 AI 美 공군, 향후 10년간 AI 탑재 전투기 1,000대 이상 도입 BarryWhite 24.05.10 4 232
115 AI GPT-4, 재무제표 분석서 전문가 수준 넘어 [3] BarryWhite 24.05.28 4 376
114 AI 특이점이 오고 있는 오픈 AI [1] HSC 24.05.14 4 523
113 AI 제미나이 어드밴스드 왜케 맘에 안 들죠.. [4] file 방황하는물고기 24.05.31 4 586
112 AI 사티아 나델라: AI를 사람처럼 대하는 건 잘못된 현상 BarryWhite 24.05.22 4 189
111 AI 前오픈AI 직원: AI, 2년 내 대학생 앞지를 것 [7] BarryWhite 24.06.07 4 443
110 AI ??? : 개짖는 소리만 들어도 알 수 있습니다. [1] BarryWhite 24.06.07 3 198

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...