미니 생성형 AI 구동에 램이 많이 필요한가요?

새벽하늘
조회 수 670
2024.06.10. 17:28

이쪽엔 영 지식이 없어서 모르겠는데 아래에 몇분이 써주신 아이폰 17프로라인에 12기가램이 들어간다는 루머를 보고 궁금해졌습니다.

당장 8기가로 올라온지 1년도 안된시점에 그런 루머가 나오는거봐서는 애플도 슬슬 자체 AI플랫폼 시동을 거나 보네요.

삼성 가우스 관련 글에서도 몇번 봤지만 저는 NPU 성능만 빵빵하면 장땡인 줄 알았는데

12기가도 부족하다! 지적하는 글이 적지 않게 보여 램용량과의 상관관계가 큰가 해서 여쭤봅니다.

- Apple iPhone 15 PM White Titanium
- Apple iPad Pro 11(M4) Space Black
- Apple Watch Series 7 Graphite 45mm
- Poco X6 Pro
- Apple Airpods Pro 2
- Shure SE846 + Rmce-tw2

		14
				
1등Alternative
		2024.06.10. 17:32					
쉽게 체험해볼 수 있어요.
Ollama나 One file LLM 같은 거 애플 실리콘에서 돌려보려고 하면 램 순식간에 몇십 기가씩 녹습니다.
APU들은 그래픽 메모리가 따로 없고 시스템 메모리를 공유해서 쓰니 램 용량이 중요하죠.
물론 각 기기와 용도에 맞게 최적화되어서 나오겠지만 그래도 지금의 일반적인 정도로는 부족한 게 맞습니다.

					 1
					
					[Alternative]님의 댓글을 신고합니다.
					취소
					신고
					
AlieNaTiZ
						 Alternative 님께
				
		2024.06.10. 17:36					
쉽게 말해 모바일 기기에서의 최적화는 원래 타겟 성능으로 만든 모델의 용량을 줄이는 일이죠. 파라미터를 줄이고, 레이어 개수를 줄이는 일반적으로 알려진 방법으로 많이 줄입니다. 그렇다 보니 모바일 기기에 들어가는 모델은 원래 타겟 모델 대비 성능이 떨어지고, 할 수 있는 기능이 줄어드는것은 어쩔 수 없죠.
 
AI 연구하시는 분들이 튜닝할 때 쓰는 방법도 삼성이나 기업에서 많이 한다고 들었습니다. 내부에서는 타겟 모델도 모바일 기기의 성능 한계로 넣지 못하는 고가치 모델도 많다고 하네요.

					 2
					
					[AlieNaTiZ]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이새벽하늘
						 Alternative 님께
				
		2024.06.10. 17:55					
생각해보니 워크스테이션은 전용 메모리가 따로 있고 모바일은 통합 메모리인걸 생각 못했네요. 통합 메모리가 더 큰 용량이 요구되는건 당연한 수순이었군요

					[새벽하늘]님의 댓글을 신고합니다.
					취소
					신고
					
2등씨샾
		2024.06.10. 17:33					
저는 생성형 ai자체가 그냥 마케팅일거란 생각을 합니다
생산성 낮은 폼팩터로 ai해봤자 얼마나 쓸까요?
램은 그냥 구실이죠

					 1
					
					[씨샾]님의 댓글을 신고합니다.
					취소
					신고
					
best사골센서
						 씨샾 님께
				
		2024.06.10. 17:39					
저 S24 AI 기능 중에 온디바이스로 돌아가는 음성인식, 번역만 해도 매일 써요.. 지금은 대부분 클라우드에 의존 중이지만 엣지에서 할 수 있는 일이 늘어나는 건 좋은 일이죠

					 4
					
					[사골센서]님의 댓글을 신고합니다.
					취소
					신고
					
씨샾
						 사골센서 님께
				
		2024.06.10. 17:43					
2개다 ai 없어도 되는거 아닌가요?
그전부터 됐던거같은데요?

					[씨샾]님의 댓글을 신고합니다.
					취소
					신고
					
best사골센서
						 씨샾 님께
				
		2024.06.10. 17:50					
네 물론 되긴 했었죠. 성능이 영 안 좋거나 무조건 클라우드를 거치는 방식이거나 둘 중 하나였지만요. 그런 것들도 대대적으로 홍보된 적만 없을 뿐이지 다 AI 기반이에요 

					 5
					
					[사골센서]님의 댓글을 신고합니다.
					취소
					신고
					
3등딸기맛치킨
		2024.06.10. 17:35					
AI이미지 제너레이터들 최소 사양이 GPU메모리 6기가 입니다.
스마트폰은 공유로 사용하니까OS가 차지하는 부분까지 감안하면 8기가도 부족하겠죠?

					 2
					
					[딸기맛치킨]님의 댓글을 신고합니다.
					취소
					신고
					
글쓴이새벽하늘
						 딸기맛치킨 님께
				
		2024.06.10. 17:56					
요즘 글카에서 별거 아닌 용량이지만.. 모바일로 오면 얘기가 많이 달라지네요 ㄷㄷ

					[새벽하늘]님의 댓글을 신고합니다.
					취소
					신고
					
퍼핑
		2024.06.10. 17:36					
갤럭시 네이놈 16기가 기본으로넣어라!!

					 1
					
					[퍼핑]님의 댓글을 신고합니다.
					취소
					신고
					
ㅇㅁㅇ
		2024.06.10. 17:43					
다다익램인 것은 맞긴 맞고,  안드로이드나 윈도우 같은 것들은 백그라운드 정책상 램이 많은게 좋긴 좋은데.. ap 크기도 그렇고 갈수록 가격 인상될 요인들만 널린 것 같네요...

					 1
					
					[ㅇㅁㅇ]님의 댓글을 신고합니다.
					취소
					신고
					
best사골센서
		2024.06.10. 17:45					
쓸만한 성능이 나오는 생성형은 모델 크기 자체가 기본으로 몇 GB씩 나가는데, 대충 2GB라고 치고 텍스트를 예로 들면 단어 하나(정확히는 토큰) 생성할 때마다 이 2GB를 다 읽어야 돼요. 플래시 메모리에서 바로 읽어오면 생성 속도가 너무 느려서 못 쓸 정도가 되니 전부 램에 올려서 쓰는 게 최선이죠

					 5
					
					[사골센서]님의 댓글을 신고합니다.
					취소
					신고
					
에드기인
		2024.06.10. 19:46					
현행 8기가 달아주는 S24가 램이 부족해서 AI가 안되네 어쩌네 이런 얘기가 안나오는거보면 딱히 그렇게 중요한가 싶기도해요

					 1
					
					[에드기인]님의 댓글을 신고합니다.
					취소
					신고
					
LaPL
		2024.06.10. 19:56					
딥러닝 모델의 추론과정은 간단하게는 입력에 연속적인 행렬곱 연산이 주류인데, (((입력 @ A) @ B ) @ C) @ D = 결과물 입니다. (@는 행렬곱 연산)
 
이 때 필요한 메모리 공간은 모델의 가중치(A,B,C,D)를 저장할 공간 (수 billion x 2 (또는 1) byte)와 입력@A 를 계산 후 그 계산결과를 다음 계산을 위해서 중간에 저장할 공간인 activation 메모리(입력의 크기에 따라 달라짐, 모든 행렬곱 연산이 같은 크기의 결과를 계산해서 하나의 출력 버퍼를 재사용 가능하다 했을 경우)가 필요합니다. 
 
GPU나 NPU는 저 @ 행렬곱 연산을 빨리 해 줄 수는 있지만, 태생적으로 가중치와 중간 결과값을 저장할 메모리가 필요합니다. ML SYS (딥러닝 모델을 잘 돌려주는 S/W) 연구도 태반이 얼마나 저 메모리를 잘 쓸 것인가 일 정도로 중요한 주제이죠. 

					 1
					
					[LaPL]님의 댓글을 신고합니다.
					취소
					신고

에디터로 글쓰기

번호	분류	제목	글쓴이	날짜	조회 수
공지	공지	사이트 이용 수칙 240809 수정	admin	18.08.04	120225	13
핫글	미니	3년만에 기변이네요 [3]	도저히못참겠다	24.09.28	885	15
핫글	미니	아이폰 16 프맥 원신 구동도 15 프맥보다 훨씬 개선되었다네요. [3]	요트맨	24.09.28	1024	8
핫글	미니	갤럭시가 나아가야 할 카메라 방향타 6 (Pixel 9Pro 50MP) [2]	S.R	00:35	276	6
218654	미니	삼성도 3단 폴드 준비하고는 있겠죠.? [14]	크로아츠	24.09.14	1125	3
218653	미니	생각보다 아이폰 카메라 무음 만족도가 높네요 [8]	Alternative	24.09.14	1447	15
218652	미니	삼성, SF2A Ambarella ADAS 칩 수주 [5]	갠냑시	24.09.14	906	3
218651	미니	워.. 버즈3 프로 기대 이상인데요? 이 정도면 올해 BEST는 이놈이네요 ㄷㄷ [21]	TempNick	24.09.14	1689	22
218650	미니	[란즈크] 애플 아이폰16, 8기가램 탑재는 소비자를 위한 최적의 선택 [7]	Why'zner	24.09.14	1426	6
218649	미니	TCN: 아이폰 15, 16프로 카메라는 6.1MP 수준 [9]	S.R	24.09.14	900	4
218648	미니	잡담: 처참한 구글 텐서 G4의 SPEC2006 벤치마크 결과 [8]	Section31	24.09.14	897	2
218647	미니	아이폰 샀는데 케이스들은 사셨나요? [11]	심플리	24.09.14	554	3
218646	미니	버즈3 노멀 qc 봐주세요 예민 하신 분들 들어오세요 [5]	AurA	24.09.14	568	5
218645	미니	초광각 카메라 성능이 중요한 이유가 뭘까요? [14]	얼음	24.09.14	960	2
218644	미니	일반 버즈3 모델도 피해 갈 수 없는 qc검증의 타임 [10]	빅코	24.09.14	1162	3
218643	미니	스마트폰 카메라가 정말 많이 발전하긴 했네요 [2]	KIKIRAKA	24.09.14	843	8
218642	미니	콘솔이 독점작 팔아서 돈번다는 얘기는 틀린말이라고 생각합니다 [10]	Qkooqq	24.09.14	1005	8
218641	미니	S25 플러스는 무게 루머 나온 게 있나요? [3]	참깨돌이	24.09.14	912	3
218640	미니	화웨이 3단 폴드는 90hz였군요 [15]	Beoplay31	24.09.14	1161	6
218639	미니	아무리 생각해도 이번 소니의 노림수를 모르겠습니다.feat 콘솔의 역사 [25]	SM-G986N	24.09.14	1151	5
218638	미니	미코에서 배운 스마트 셀렉트 + 원핸오 연동 [4]	펄럭펄럭	24.09.14	878	5
218637	미니	마소님 사랑해요. [7]	BarryWhite	24.09.14	590	4
218636	미니	어제 나온 AMD 및 인텔 소식 정리 [4]	BarryWhite	24.09.14	1167	2
218635	미니	지금 플스5 구매 어떤가요 [12]	닉포토	24.09.14	470	0
218634	미니	갤럭시 A35 원래 사진 품질이 이런가요? [8]	김근홍	24.09.14	1129	8
218633	미니	내년 하위라인 초광각에 AF만 들어가면 딱일듯하네요. [7]	흡혈귀왕	24.09.14	534	7
218632	미니	이번 폴드6 광고 마음에 드네요 [12]	[성공]함께크는성장	24.09.14	1041	7
218631	미니	S25 램은 12/12/16일까요? [6]	애애앵	24.09.14	942	0
218630	미니	아이폰은 16 시리즈보단 SE가 기대 되네요! [2]	가을	24.09.14	683	6

👨‍👩‍👧‍👦미코🌕

미니 생성형 AI 구동에 램이 많이 필요한가요?

추천 IT 소식 [1/]

스킨 기본정보

확장 변수

1. 게시판 기본 설정

2. 글 목록

3. 갤러리 설정

4. 글 읽기 화면

5. 댓글 설정

6. 글 쓰기 화면 설정