로그인 해주세요.

AI / 로봇 게시판 *AI / 로봇에 관해 교류하는 게시판입니다.

Eomjunsik

AI 어느새 눈 앞으로 다가온 온디바이스 LLM 시대

어제 공개된 Meta의 Llama 3는 8B, 70B 두개의 종류가 선공개 되었습니다.

여기서 주목하셔야 하는 것은 8B 모델의 성능입니다.

Screenshot 2024-04-20 at 00.32.24.png현존하는 LLM 평가 방식 중 그나마 체감에 가깝다고 여겨지는 LLM Arena 결과입니다. 아직 초기 결과에 불과하지만 instuction-tuned 버전의 Llama 3 8B가 Gemini Pro, Claude 2.1, GPT 3.5를 모두 능가하는 성능을 보여줍니다.

 

이것이 큰 의미를 갖는 이유는

 

1. Meta가 공개하는 Instruction-tuned 버전은 기초적인 fine-tuning만 된 것으로 아직도 성능 향상의 여지가 큼.

2. 이 모델이 이미 능가하는 GPT 3.5는 사용자가 불편함을 느끼지 않을 수 있는 LLM 성능의 마지노선임.

2. 8B는 8bit 양자화 기준 8GB, 4bit 양자화 기준 4GB의 램을 요구하기 때문에 On-device 구현의 마지노선 사이즈임.

 

위와 같습니다. 즉 성능, 용량적인 면에서 On-device LLM 구현의 9부 능선을 넘었다는거죠. 메타가 이번에 8B 버전의 성능 향상에 특히 노력한 것도 다분히 의도적으로 보이구요.

 

현실적으로 현재의 Galaxy AI와 같이 대부분의 처리를 서버에 의존하는 방법은 지속 가능하지 않습니다. 삼성이 부담해야 하는 서버비 or 로열티적인 면에서도 그렇구요. 사용자 경험 측면에서도 일단 데이터 사용량과 레이턴시를 무시할 수 없으니까요.

 

결국 나아가야 하는 방향은 구글과 애플이 누구보다 잘 알고 있듯이 On-device 탑재입니다. AI 기능을 사용할 때마다 램에 몇기가씩 로드할수는 없으니 상시 로딩해 놓는것에 가깝게 준비해야겠죠. 즉, 내년부터 공개될 진정한 AI 스마트폰의 램은 최소 4GB는 빼고 보셔야 할겁니다. 12GB면 8+4GB 이런 느낌인거죠.

 

온디바이스로 항상 나를 위해 준비된 GPT 3.5라니, 생각만 해도 너무 좋습니다. 이와중에 S25는 여전히 8GB Variant가 존재한다는 소문이 있던데.. 제정신인가 싶습니다. 8GB 모델은 One UI 8 업뎃시 AI 기능 제외, 이런 헤드라인 감당할 수 있나요?





+추가) 에이, 이 사람 또 호들갑떠네. 이런 생각이 드신다면 바로 사용해보시길 권합니다.


https://llama3.replicate.dev/

여기서 8B 고르시면 바로 써보실 수 있습니다. 깜짝 놀라실걸요.

Eomjunsik
📱 Samsung Galaxy S24 & Apple iPhone 14 Pro

📝 Samsung Galaxy Tab S9

💻 Apple MacBook Air M1

🖥️ Samsung S27A700

🎮 AMD R5 5600 + RX 6600

🎧 Sony WH-1000XM5 / Samsung Galaxy Buds Live

📖 Onyx Poke 5
댓글
9
Eomjunsik
글쓴이
Eomjunsik S24울트라존버 님께
2024.04.20. 00:49

정신나간 짓 3대장 중 라이트닝은 이제 가셨고

노멀 8GB와 노멀 60Hz만 남았네요.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
구보
2등 구보
2024.04.20. 00:48

제 예측으로는 갤럭시에 본문에서 언급하신 형태의 온디바이스 AI가 나오면 기본형 8GB가 존재하는 세대는 램이 넉넉해도 같이 컷 당할거 같아요.. 아니면 울트라만 해주거나? 

[구보]님의 댓글을 신고합니다. 취소 신고
Eomjunsik
글쓴이
Eomjunsik 구보 님께
2024.04.20. 00:49

아직은 불행회로에 불과하지만.. 현실화되지 않기만을 바랍니다.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
BarryWhite
3등 BarryWhite
2024.04.20. 00:49

이미 모바일 디램이 24GB 32GB가 나온 걸루 아는데

아직도 8/12GB라는 게 참 아쉽읍니다.

삼성이나 애플이나 얼른 램을 올려줬으면 좋겠네요.

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
Eomjunsik
글쓴이
Eomjunsik BarryWhite 님께
2024.04.20. 00:50

램 가격이 역대 최저가를 찍을때도 안올려준 놈들이 지금 올려줄까 싶긴 합니다.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
BarryWhite
BarryWhite Eomjunsik 님께
2024.04.20. 00:53

"램 공급이 많아져서 가격이 떨어지면 분명 램을 늘려줄겁니다"

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
성능확실
성능확실
2024.04.20. 01:35

IMG_1271.png

 

아이폰15프로로 llama2 7b 모델을 온디바이스로 돌려서 써보고 있는데 응답속도는 꽤 빠르긴 한데 램을 엄청나게 잡아먹는지 이것만 켜면 다른 앱들이 약간씩 버벅이더라구요. 아이폰,갤럭시 둘 다 llm을 제대로 쓰려면 램 용량을 확 늘려줘야 할 것 같습니다🥲

[성능확실]님의 댓글을 신고합니다. 취소 신고
sjkoon
sjkoon
2024.04.20. 07:51

결국 온디바이스AI 는 램이 관건이네요. 애플로서는 고심이 깊어질거 같군요..

[sjkoon]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 AI AI / 로봇 게시판 이용 수칙 240418 [4] admin 24.04.18 3 170
핫글 AI 오픈AI, GPT-4o 유료 기능 차트·맞춤챗봇 등 무료화 BarryWhite 16:30 2 118
59 AI 오픈AI, AI 검색 발표 부정...GPT-4 공개가 먼저 BarryWhite 24.05.11 1 283
58 AI 오픈AI, AI 성인 콘텐츠 제작 허용 검토 중 [5] BarryWhite 24.05.10 5 621
57 AI 스탠퍼드대, AI 기반 홀로그램 이미징 기술 개발 착수 BarryWhite 24.05.10 0 80
56 AI 美 공군, 향후 10년간 AI 탑재 전투기 1,000대 이상 도입 BarryWhite 24.05.10 4 219
55 AI 알리바바 자체 LLM, 中 9만개 기업 채택 BarryWhite 24.05.10 0 119
54 AI MS, 프롬프트까지 생성해주는 코파일럿 기능 공개 BarryWhite 24.05.09 1 129
53 AI 구글 딥마인드, 알파폴드3 공개: AI로 신약 개발 BarryWhite 24.05.09 0 137
52 로봇 엔비디아, LLM 기반 로봇 훈련 기술 닥터유레카 공개 [1] BarryWhite 24.05.08 0 128
51 AI 오픈AI, AI 학습 차단 도구 개발 중 BarryWhite 24.05.08 0 78
50 AI 오픈AI, AI 생성 오디오 추적 도구 개발 BarryWhite 24.05.08 0 36
49 AI 오픈AI, 챗GPT용 검색 기능 개발 중 BarryWhite 24.05.08 0 47
48 AI 우크라이나, AI 대변인 빅토리아 시 공개 BarryWhite 24.05.08 1 66
47 AI MS, 미국 스파이를 위한 일급 비밀 AI 도구 개발 [2] BarryWhite 24.05.08 2 226
46 AI 일론 머스크: AI, 우주 개발에는 아직 도움 안 돼 BarryWhite 24.05.07 0 80
45 AI AI 혐오 표현 금지가 표현의 자유를 억압한다? BarryWhite 24.05.07 1 107
44 로봇 MS, AI 이어 범용로봇 진출한다 BarryWhite 24.05.06 1 79
43 AI 엔비디아, Run:ai 이어 Deci 인수 BarryWhite 24.05.05 0 124
42 AI 파이어플라이 AI 들어간 어도비 익스프레스앱 나왔읍니다. BarryWhite 24.05.03 0 54
41 AI MS, 생츄어리AI와 손잡았다…범용 휴머노이드 AI 개발 나서 뉴스봇 24.05.03 0 61
40 AI 그림쟁이 다 죽는다...싶은 AI 모델 등장 file BarryWhite 24.05.02 5 454
39 AI AI로 가장 위협받는 프리랜서 일자리는? BarryWhite 24.05.02 0 134
38 AI GPT 게섰거라 앤트로픽 클로드 AI iOS 앱 선보여 BarryWhite 24.05.02 0 105
37 AI AI가 도축 자동화를 가속화하고 있답니다. [9] BarryWhite 24.05.02 8 758
36 AI 구글, AI 학습용 이미지 무단 사용으로 소송당해 [2] BarryWhite 24.05.01 2 328
35 AI 심방세동 30분 전 예측하는 AI 개발 BarryWhite 24.04.30 0 161

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...