AI 어느새 눈 앞으로 다가온 온디바이스 LLM 시대

Eomjunsik
조회 수 780
2024.04.20. 00:40

어제 공개된 Meta의 Llama 3는 8B, 70B 두개의 종류가 선공개 되었습니다.

여기서 주목하셔야 하는 것은 8B 모델의 성능입니다.

Screenshot 2024-04-20 at 00.32.24.png 현존하는 LLM 평가 방식 중 그나마 체감에 가깝다고 여겨지는 LLM Arena 결과입니다. 아직 초기 결과에 불과하지만 instuction-tuned 버전의 Llama 3 8B가 Gemini Pro, Claude 2.1, GPT 3.5를 모두 능가하는 성능을 보여줍니다.

이것이 큰 의미를 갖는 이유는

1. Meta가 공개하는 Instruction-tuned 버전은 기초적인 fine-tuning만 된 것으로 아직도 성능 향상의 여지가 큼.

2. 이 모델이 이미 능가하는 GPT 3.5는 사용자가 불편함을 느끼지 않을 수 있는 LLM 성능의 마지노선임.

2. 8B는 8bit 양자화 기준 8GB, 4bit 양자화 기준 4GB의 램을 요구하기 때문에 On-device 구현의 마지노선 사이즈임.

위와 같습니다. 즉 성능, 용량적인 면에서 On-device LLM 구현의 9부 능선을 넘었다는거죠. 메타가 이번에 8B 버전의 성능 향상에 특히 노력한 것도 다분히 의도적으로 보이구요.

현실적으로 현재의 Galaxy AI와 같이 대부분의 처리를 서버에 의존하는 방법은 지속 가능하지 않습니다. 삼성이 부담해야 하는 서버비 or 로열티적인 면에서도 그렇구요. 사용자 경험 측면에서도 일단 데이터 사용량과 레이턴시를 무시할 수 없으니까요.

결국 나아가야 하는 방향은 구글과 애플이 누구보다 잘 알고 있듯이 On-device 탑재입니다. AI 기능을 사용할 때마다 램에 몇기가씩 로드할수는 없으니 상시 로딩해 놓는것에 가깝게 준비해야겠죠. 즉, 내년부터 공개될 진정한 AI 스마트폰의 램은 최소 4GB는 빼고 보셔야 할겁니다. 12GB면 8+4GB 이런 느낌인거죠.

온디바이스로 항상 나를 위해 준비된 GPT 3.5라니, 생각만 해도 너무 좋습니다. 이와중에 S25는 여전히 8GB Variant가 존재한다는 소문이 있던데.. 제정신인가 싶습니다. 8GB 모델은 One UI 8 업뎃시 AI 기능 제외, 이런 헤드라인 감당할 수 있나요?

+추가) 에이, 이 사람 또 호들갑떠네. 이런 생각이 드신다면 바로 사용해보시길 권합니다.

https://llama3.replicate.dev/

여기서 8B 고르시면 바로 써보실 수 있습니다. 깜짝 놀라실걸요.

		9
				
1등S24울트라존버
		2024.04.20. 00:47					
8기가램은이제 폐기처분해야..

					 1
					
					[S24울트라존버]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이Eomjunsik
						 S24울트라존버 님께
				
		2024.04.20. 00:49					
정신나간 짓 3대장 중 라이트닝은 이제 가셨고
노멀 8GB와 노멀 60Hz만 남았네요.

					[Eomjunsik]님의 댓글을 신고합니다.
					취소
					신고
					
2등구보
		2024.04.20. 00:48					
제 예측으로는 갤럭시에 본문에서 언급하신 형태의 온디바이스 AI가 나오면 기본형 8GB가 존재하는 세대는 램이 넉넉해도 같이 컷 당할거 같아요.. 아니면 울트라만 해주거나? 

					[구보]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이Eomjunsik
						 구보 님께
				
		2024.04.20. 00:49					
아직은 불행회로에 불과하지만.. 현실화되지 않기만을 바랍니다.

					[Eomjunsik]님의 댓글을 신고합니다.
					취소
					신고
					
3등BarryWhite
		2024.04.20. 00:49					
이미 모바일 디램이 24GB 32GB가 나온 걸루 아는데
아직도 8/12GB라는 게 참 아쉽읍니다.
삼성이나 애플이나 얼른 램을 올려줬으면 좋겠네요.

					 1
					
					[BarryWhite]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이Eomjunsik
						 BarryWhite 님께
				
		2024.04.20. 00:50					
램 가격이 역대 최저가를 찍을때도 안올려준 놈들이 지금 올려줄까 싶긴 합니다.

					 1
					
					[Eomjunsik]님의 댓글을 신고합니다.
					취소
					신고
					
BarryWhite
						 Eomjunsik 님께
				
		2024.04.20. 00:53					

"램 공급이 많아져서 가격이 떨어지면 분명 램을 늘려줄겁니다"

					 1
					
					[BarryWhite]님의 댓글을 신고합니다.
					취소
					신고
					
성능확실
		2024.04.20. 01:35					
 
아이폰15프로로 llama2 7b 모델을 온디바이스로 돌려서 써보고 있는데 응답속도는 꽤 빠르긴 한데 램을 엄청나게 잡아먹는지 이것만 켜면 다른 앱들이 약간씩 버벅이더라구요. 아이폰,갤럭시 둘 다 llm을 제대로 쓰려면 램 용량을 확 늘려줘야 할 것 같습니다🥲

					[성능확실]님의 댓글을 신고합니다.
					취소
					신고
					
sjkoon
		2024.04.20. 07:51					
결국 온디바이스AI 는 램이 관건이네요. 애플로서는 고심이 깊어질거 같군요..

					 1
					
					[sjkoon]님의 댓글을 신고합니다.
					취소
					신고

에디터로 글쓰기

번호	분류	제목	글쓴이	날짜		조회 수
공지	AI	AI / 로봇 게시판 이용 수칙 240418 [4]	admin	24.04.18	3	261
37	AI	AI가 도축 자동화를 가속화하고 있답니다. [9]	BarryWhite	24.05.02	8	778
36	AI	구글, AI 학습용 이미지 무단 사용으로 소송당해 [2]	BarryWhite	24.05.01	2	341
35	AI	심방세동 30분 전 예측하는 AI 개발	BarryWhite	24.04.30	0	172
34	AI	SKT: 텔코LLM 6월 개발 완료할 것	BarryWhite	24.04.30	0	169
33	AI	코파일럿 포 MS365 한국어 공식 지원	BarryWhite	24.04.30	1	204
32	AI	달리 그림-2- [1]	곰장수	24.04.28	7	278
31	AI	AI 활용 피 검사 연구, 암 식별도 가능 [2]	BarryWhite	24.04.25	0	146
30	AI	코카콜라-MS, AI 개발 5년 계약	BarryWhite	24.04.25	0	139
29	AI	애플, AI 모델 오픈ELM 시리즈 공개	BarryWhite	24.04.25	0	167
28	AI	어도비, 기반 모델 파이어플라이3 공개 [1]	BarryWhite	24.04.25	1	208
27	AI	구글·메타·MS, 아동 성학대 자료 AI 학습 제외	BarryWhite	24.04.24	0	95
26	AI	MS가 소형 AI 모델 파이3(Phi-3) 3종 공개했습니다.	BarryWhite	24.04.24	0	132
25	AI	구글, 안드로이드용 제미니 앱에 실시간 응답 방식 추가 예정?	BarryWhite	24.04.22	0	175
24	AI	아마존, AI 기반 전자책 증가	BarryWhite	24.04.22	0	111
23	AI	MS, 엔디비아 관계자 서울 모인다…국제 AI 표준 논의	BarryWhite	24.04.22	0	123
22	로봇	카카오모빌리티, 로봇 배송 서비스 브링 출시	BarryWhite	24.04.22	0	96
21	AI	새로 발견한 엑시노스 의외의 단점 [7]	Eomjunsik	24.04.22	6	621
20	AI	美 유나이티드항공, AI 기술 활용 박차…운영 효율 향상	BarryWhite	24.04.22	0	99
19	AI	마크 저커버그: AI 학습 데이터 경쟁, 피드백 루프 가장 중요	BarryWhite	24.04.22	0	120
18	AI	틱톡, AI 음성 복제 기능 도입 전망 [4]	BarryWhite	24.04.21	1	238
17	AI	챗GPT 요즘 답변 진짜 성의없이 하고 없는 말을 지어내는군요. [5]	흡혈귀왕	24.04.20	7	947
16	AI	LA, AI를 노숙자 예측 및 지원하는데에 사용 중 [2]	BarryWhite	24.04.20	1	248
15	AI	구글, 딥마인드·리서치 팀 합병 발표	BarryWhite	24.04.20	0	191
14	AI	MS 워드 코파일럿, 빙 검색 결과 받아올 예정	BarryWhite	24.04.20	0	135
	AI	어느새 눈 앞으로 다가온 온디바이스 LLM 시대 [9]	Eomjunsik	24.04.20	7	780

👨‍👩‍👧‍👦미코🌕

AI 어느새 눈 앞으로 다가온 온디바이스 LLM 시대

추천 IT 소식 [1/]

스킨 기본정보

확장 변수

1. 게시판 기본 설정

2. 글 목록

3. 갤러리 설정

4. 글 읽기 화면

5. 댓글 설정

6. 글 쓰기 화면 설정