로그인 해주세요.

AI / 로봇 게시판 *AI / 로봇에 관해 교류하는 게시판입니다.

AI 어느새 눈 앞으로 다가온 온디바이스 LLM 시대

어제 공개된 Meta의 Llama 3는 8B, 70B 두개의 종류가 선공개 되었습니다.

여기서 주목하셔야 하는 것은 8B 모델의 성능입니다.

Screenshot 2024-04-20 at 00.32.24.png현존하는 LLM 평가 방식 중 그나마 체감에 가깝다고 여겨지는 LLM Arena 결과입니다. 아직 초기 결과에 불과하지만 instuction-tuned 버전의 Llama 3 8B가 Gemini Pro, Claude 2.1, GPT 3.5를 모두 능가하는 성능을 보여줍니다.

 

이것이 큰 의미를 갖는 이유는

 

1. Meta가 공개하는 Instruction-tuned 버전은 기초적인 fine-tuning만 된 것으로 아직도 성능 향상의 여지가 큼.

2. 이 모델이 이미 능가하는 GPT 3.5는 사용자가 불편함을 느끼지 않을 수 있는 LLM 성능의 마지노선임.

2. 8B는 8bit 양자화 기준 8GB, 4bit 양자화 기준 4GB의 램을 요구하기 때문에 On-device 구현의 마지노선 사이즈임.

 

위와 같습니다. 즉 성능, 용량적인 면에서 On-device LLM 구현의 9부 능선을 넘었다는거죠. 메타가 이번에 8B 버전의 성능 향상에 특히 노력한 것도 다분히 의도적으로 보이구요.

 

현실적으로 현재의 Galaxy AI와 같이 대부분의 처리를 서버에 의존하는 방법은 지속 가능하지 않습니다. 삼성이 부담해야 하는 서버비 or 로열티적인 면에서도 그렇구요. 사용자 경험 측면에서도 일단 데이터 사용량과 레이턴시를 무시할 수 없으니까요.

 

결국 나아가야 하는 방향은 구글과 애플이 누구보다 잘 알고 있듯이 On-device 탑재입니다. AI 기능을 사용할 때마다 램에 몇기가씩 로드할수는 없으니 상시 로딩해 놓는것에 가깝게 준비해야겠죠. 즉, 내년부터 공개될 진정한 AI 스마트폰의 램은 최소 4GB는 빼고 보셔야 할겁니다. 12GB면 8+4GB 이런 느낌인거죠.

 

온디바이스로 항상 나를 위해 준비된 GPT 3.5라니, 생각만 해도 너무 좋습니다. 이와중에 S25는 여전히 8GB Variant가 존재한다는 소문이 있던데.. 제정신인가 싶습니다. 8GB 모델은 One UI 8 업뎃시 AI 기능 제외, 이런 헤드라인 감당할 수 있나요?





+추가) 에이, 이 사람 또 호들갑떠네. 이런 생각이 드신다면 바로 사용해보시길 권합니다.


https://llama3.replicate.dev/

여기서 8B 고르시면 바로 써보실 수 있습니다. 깜짝 놀라실걸요.

댓글
9
글쓴이
Eomjunsik S24울트라존버 님께
2024.04.20. 00:49

정신나간 짓 3대장 중 라이트닝은 이제 가셨고

노멀 8GB와 노멀 60Hz만 남았네요.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
구보
2등 구보
2024.04.20. 00:48

제 예측으로는 갤럭시에 본문에서 언급하신 형태의 온디바이스 AI가 나오면 기본형 8GB가 존재하는 세대는 램이 넉넉해도 같이 컷 당할거 같아요.. 아니면 울트라만 해주거나? 

[구보]님의 댓글을 신고합니다. 취소 신고
글쓴이
Eomjunsik 구보 님께
2024.04.20. 00:49

아직은 불행회로에 불과하지만.. 현실화되지 않기만을 바랍니다.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
BarryWhite
3등 BarryWhite
2024.04.20. 00:49

이미 모바일 디램이 24GB 32GB가 나온 걸루 아는데

아직도 8/12GB라는 게 참 아쉽읍니다.

삼성이나 애플이나 얼른 램을 올려줬으면 좋겠네요.

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
글쓴이
Eomjunsik BarryWhite 님께
2024.04.20. 00:50

램 가격이 역대 최저가를 찍을때도 안올려준 놈들이 지금 올려줄까 싶긴 합니다.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
BarryWhite
BarryWhite Eomjunsik 님께
2024.04.20. 00:53

"램 공급이 많아져서 가격이 떨어지면 분명 램을 늘려줄겁니다"

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
성능확실
성능확실
2024.04.20. 01:35

IMG_1271.png

 

아이폰15프로로 llama2 7b 모델을 온디바이스로 돌려서 써보고 있는데 응답속도는 꽤 빠르긴 한데 램을 엄청나게 잡아먹는지 이것만 켜면 다른 앱들이 약간씩 버벅이더라구요. 아이폰,갤럭시 둘 다 llm을 제대로 쓰려면 램 용량을 확 늘려줘야 할 것 같습니다🥲

[성능확실]님의 댓글을 신고합니다. 취소 신고
sjkoon
sjkoon
2024.04.20. 07:51

결국 온디바이스AI 는 램이 관건이네요. 애플로서는 고심이 깊어질거 같군요..

[sjkoon]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 AI AI / 로봇 게시판 이용 수칙 240418 [4] admin 24.04.18 3 261
37 AI AI가 도축 자동화를 가속화하고 있답니다. [9] BarryWhite 24.05.02 8 778
36 AI 구글, AI 학습용 이미지 무단 사용으로 소송당해 [2] BarryWhite 24.05.01 2 341
35 AI 심방세동 30분 전 예측하는 AI 개발 BarryWhite 24.04.30 0 172
34 AI SKT: 텔코LLM 6월 개발 완료할 것 BarryWhite 24.04.30 0 169
33 AI 코파일럿 포 MS365 한국어 공식 지원 BarryWhite 24.04.30 1 204
32 AI 달리 그림-2- [1] file 곰장수 24.04.28 7 278
31 AI AI 활용 피 검사 연구, 암 식별도 가능 [2] BarryWhite 24.04.25 0 146
30 AI 코카콜라-MS, AI 개발 5년 계약 BarryWhite 24.04.25 0 139
29 AI 애플, AI 모델 오픈ELM 시리즈 공개 BarryWhite 24.04.25 0 167
28 AI 어도비, 기반 모델 파이어플라이3 공개 [1] BarryWhite 24.04.25 1 208
27 AI 구글·메타·MS, 아동 성학대 자료 AI 학습 제외 BarryWhite 24.04.24 0 95
26 AI MS가 소형 AI 모델 파이3(Phi-3) 3종 공개했습니다. BarryWhite 24.04.24 0 132
25 AI 구글, 안드로이드용 제미니 앱에 실시간 응답 방식 추가 예정? file BarryWhite 24.04.22 0 175
24 AI 아마존, AI 기반 전자책 증가 BarryWhite 24.04.22 0 111
23 AI MS, 엔디비아 관계자 서울 모인다…국제 AI 표준 논의 BarryWhite 24.04.22 0 123
22 로봇 카카오모빌리티, 로봇 배송 서비스 브링 출시 BarryWhite 24.04.22 0 96
21 AI 새로 발견한 엑시노스 의외의 단점 [7] file Eomjunsik 24.04.22 6 621
20 AI 美 유나이티드항공, AI 기술 활용 박차…운영 효율 향상 BarryWhite 24.04.22 0 99
19 AI 마크 저커버그: AI 학습 데이터 경쟁, 피드백 루프 가장 중요 BarryWhite 24.04.22 0 120
18 AI 틱톡, AI 음성 복제 기능 도입 전망 [4] file BarryWhite 24.04.21 1 238
17 AI 챗GPT 요즘 답변 진짜 성의없이 하고 없는 말을 지어내는군요. [5] 흡혈귀왕 24.04.20 7 947
16 AI LA, AI를 노숙자 예측 및 지원하는데에 사용 중 [2] BarryWhite 24.04.20 1 248
15 AI 구글, 딥마인드·리서치 팀 합병 발표 BarryWhite 24.04.20 0 191
14 AI MS 워드 코파일럿, 빙 검색 결과 받아올 예정 file BarryWhite 24.04.20 0 135
AI 어느새 눈 앞으로 다가온 온디바이스 LLM 시대 [9] file Eomjunsik 24.04.20 7 780

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.