로그인 해주세요.

미니기기 / 음향 게시판 *스마트폰과 PC, 카메라, 스피커 등 IT 미니기기와 음향기기에 관해 교류하는 게시판입니다.

새벽하늘

미니 생성형 AI 구동에 램이 많이 필요한가요?

이쪽엔 영 지식이 없어서 모르겠는데 아래에 몇분이 써주신 아이폰 17프로라인에 12기가램이 들어간다는 루머를 보고 궁금해졌습니다.

당장 8기가로 올라온지 1년도 안된시점에 그런 루머가 나오는거봐서는 애플도 슬슬 자체 AI플랫폼 시동을 거나 보네요.

 

삼성 가우스 관련 글에서도 몇번 봤지만 저는 NPU 성능만 빵빵하면 장땡인 줄 알았는데

12기가도 부족하다! 지적하는 글이 적지 않게 보여 램용량과의 상관관계가 큰가 해서 여쭤봅니다.

새벽하늘
- Apple iPhone 15 PM White Titanium
- Poco X6 Pro
- Apple Watch Series 7 Graphite 45mm
- Apple Airpods Pro 2
- Shure SE846 + Rmce-tw2

- MSI B660M MORTAR WIFI DDR4
- Intel Core I5-13600KF
- Teamgroup T-Force Delta DDR4 3600MHz 8×4GB
- MSI Geforce RTX 3080 SUPRIM X 10GB
- SK Hynix Gold P31 1TB x2 + Micron Crucial MX500 500GB
- Enermax REVOLUTION D.F. ERF850EWT
- LG 27GP850
- CORSAIR K70 TKL RGB
- RAZER Viper V2 pro
댓글
14
Alternative
1등 Alternative
2024.06.10. 17:32

쉽게 체험해볼 수 있어요.

Ollama나 One file LLM 같은 거 애플 실리콘에서 돌려보려고 하면 램 순식간에 몇십 기가씩 녹습니다.

APU들은 그래픽 메모리가 따로 없고 시스템 메모리를 공유해서 쓰니 램 용량이 중요하죠.

물론 각 기기와 용도에 맞게 최적화되어서 나오겠지만 그래도 지금의 일반적인 정도로는 부족한 게 맞습니다.

[Alternative]님의 댓글을 신고합니다. 취소 신고
AlieNaTiZ
AlieNaTiZ Alternative 님께
2024.06.10. 17:36

쉽게 말해 모바일 기기에서의 최적화는 원래 타겟 성능으로 만든 모델의 용량을 줄이는 일이죠. 파라미터를 줄이고, 레이어 개수를 줄이는 일반적으로 알려진 방법으로 많이 줄입니다. 그렇다 보니 모바일 기기에 들어가는 모델은 원래 타겟 모델 대비 성능이 떨어지고, 할 수 있는 기능이 줄어드는것은 어쩔 수 없죠.

 

AI 연구하시는 분들이 튜닝할 때 쓰는 방법도 삼성이나 기업에서 많이 한다고 들었습니다. 내부에서는 타겟 모델도 모바일 기기의 성능 한계로 넣지 못하는 고가치 모델도 많다고 하네요.

[AlieNaTiZ]님의 댓글을 신고합니다. 취소 신고
새벽하늘
글쓴이
새벽하늘 Alternative 님께
2024.06.10. 17:55

생각해보니 워크스테이션은 전용 메모리가 따로 있고 모바일은 통합 메모리인걸 생각 못했네요. 통합 메모리가 더 큰 용량이 요구되는건 당연한 수순이었군요

[새벽하늘]님의 댓글을 신고합니다. 취소 신고
씨샾
2등 씨샾
2024.06.10. 17:33

저는 생성형 ai자체가 그냥 마케팅일거란 생각을 합니다

생산성 낮은 폼팩터로 ai해봤자 얼마나 쓸까요?

램은 그냥 구실이죠

[씨샾]님의 댓글을 신고합니다. 취소 신고
사골센서
best 사골센서 씨샾 님께
2024.06.10. 17:39

저 S24 AI 기능 중에 온디바이스로 돌아가는 음성인식, 번역만 해도 매일 써요.. 지금은 대부분 클라우드에 의존 중이지만 엣지에서 할 수 있는 일이 늘어나는 건 좋은 일이죠

[사골센서]님의 댓글을 신고합니다. 취소 신고
씨샾
씨샾 사골센서 님께
2024.06.10. 17:43

2개다 ai 없어도 되는거 아닌가요?

그전부터 됐던거같은데요?

[씨샾]님의 댓글을 신고합니다. 취소 신고
사골센서
best 사골센서 씨샾 님께
2024.06.10. 17:50

네 물론 되긴 했었죠. 성능이 영 안 좋거나 무조건 클라우드를 거치는 방식이거나 둘 중 하나였지만요. 그런 것들도 대대적으로 홍보된 적만 없을 뿐이지 다 AI 기반이에요 

[사골센서]님의 댓글을 신고합니다. 취소 신고
딸기맛치킨
3등 딸기맛치킨
2024.06.10. 17:35

AI이미지 제너레이터들 최소 사양이 GPU메모리 6기가 입니다.
스마트폰은 공유로 사용하니까OS가 차지하는 부분까지 감안하면 8기가도 부족하겠죠?

[딸기맛치킨]님의 댓글을 신고합니다. 취소 신고
새벽하늘
글쓴이
새벽하늘 딸기맛치킨 님께
2024.06.10. 17:56

요즘 글카에서 별거 아닌 용량이지만.. 모바일로 오면 얘기가 많이 달라지네요 ㄷㄷ

[새벽하늘]님의 댓글을 신고합니다. 취소 신고
퍼핑
퍼핑
2024.06.10. 17:36

갤럭시 네이놈 16기가 기본으로넣어라!!

[퍼핑]님의 댓글을 신고합니다. 취소 신고
ㅇㅁㅇ
ㅇㅁㅇ
2024.06.10. 17:43

다다익램인 것은 맞긴 맞고,  안드로이드나 윈도우 같은 것들은 백그라운드 정책상 램이 많은게 좋긴 좋은데.. ap 크기도 그렇고 갈수록 가격 인상될 요인들만 널린 것 같네요...

[ㅇㅁㅇ]님의 댓글을 신고합니다. 취소 신고
사골센서
best 사골센서
2024.06.10. 17:45

쓸만한 성능이 나오는 생성형은 모델 크기 자체가 기본으로 몇 GB씩 나가는데, 대충 2GB라고 치고 텍스트를 예로 들면 단어 하나(정확히는 토큰) 생성할 때마다 이 2GB를 다 읽어야 돼요. 플래시 메모리에서 바로 읽어오면 생성 속도가 너무 느려서 못 쓸 정도가 되니 전부 램에 올려서 쓰는 게 최선이죠

[사골센서]님의 댓글을 신고합니다. 취소 신고
에드기인
에드기인
2024.06.10. 19:46

현행 8기가 달아주는 S24가 램이 부족해서 AI가 안되네 어쩌네 이런 얘기가 안나오는거보면 딱히 그렇게 중요한가 싶기도해요

[에드기인]님의 댓글을 신고합니다. 취소 신고
LaPL
LaPL
2024.06.10. 19:56

딥러닝 모델의 추론과정은 간단하게는 입력에 연속적인 행렬곱 연산이 주류인데, (((입력 @ A) @ B ) @ C) @ D = 결과물 입니다. (@는 행렬곱 연산)

 

이 때 필요한 메모리 공간은 모델의 가중치(A,B,C,D)를 저장할 공간 (수 billion x 2 (또는 1) byte)와 입력@A 를 계산 후 그 계산결과를 다음 계산을 위해서 중간에 저장할 공간인 activation 메모리(입력의 크기에 따라 달라짐, 모든 행렬곱 연산이 같은 크기의 결과를 계산해서 하나의 출력 버퍼를 재사용 가능하다 했을 경우)가 필요합니다. 

 

GPU나 NPU는 저 @ 행렬곱 연산을 빨리 해 줄 수는 있지만, 태생적으로 가중치와 중간 결과값을 저장할 메모리가 필요합니다. ML SYS (딥러닝 모델을 잘 돌려주는 S/W) 연구도 태반이 얼마나 저 메모리를 잘 쓸 것인가 일 정도로 중요한 주제이죠. 

[LaPL]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 공지 사이트 이용 수칙 230228 수정 file admin 18.08.04 117750 13
핫글 미니 미출시 기기 3형제 [9] file Seol 24.08.06 869 15
핫글 미니 삿슈 폴드6 [1] file Minny 24.08.06 581 14
핫글 미니 초A급으로 보관중인 갤s8 인증이요. [9] file niotree 24.08.06 726 11
216009 미니 기커완 전성비 자료의 한계는 [9] gamma 24.07.10 853 9
216008 미니 이번 예구 더블 스토리지가 없나보네요 [4] file 애애앵 24.07.10 733 5
216007 미니 근데 텐서 설계는 어디서부터 문제일까요. [9] 인텔 24.07.10 610 1
216006 미니 사전예약 해택에 갤럭시링이 없네여 ㄷㄷ [6] 완벽한무선충전 24.07.10 773 1
216005 미니 폴드6/플립6 최종 구매혜택 유출(수정) [27] file a1001 24.07.10 1357 3
216004 미니 极客湾Geekerwan 전성비 차트 업데이트 (+ D9300+, E2400, Tensor G3) [10] file 좌지우건 24.07.10 879 3
216003 미니 갤갤펌) 역시나 삼성 파운드리 엑시노스는 기대를 저버리지 않네요 [27] file 애애앵 24.07.10 1877 10
216002 미니 A18프로 성능이 궁금하네요.... [5] dlwlrma 24.07.10 733 1
216001 음향 톤프리 UT90S 업데이트 있습니다. [5] file Q815S 24.07.10 321 1
216000 미니 써멀 재도포 후 부팅이 안됩니다..... [14] file SM-G986N 24.07.10 651 1
215999 미니 잡담: 1.1.179보다 못한 1.3.247이 있다?? (Vulkan API) [4] file Section31 24.07.10 488 1
215998 미니 애플도 충전속도 올리네요 [6] 적당히하자 24.07.10 889 3
215997 미니 소식: 삼성파운드리, 2nm 공정 첫 주문 수주 [13] Section31 24.07.10 1220 4
215996 미니 로스 영 : 갤폴드 6 슬림 한국버전은 SM-F958N [2] 요트맨 24.07.10 1104 1
215995 미니 사전예약 혜택.jpg [15] file 적당히하자 24.07.10 1381 2
215994 미니 왜 휴대폰 음성비서는 단독으로만 사용이 가능할까요? [8] scjang01 24.07.10 578 0
215993 미니 최근에 워치 삼성헬스 업데이트 있었나요? [1] ′Ultra′ 24.07.10 435 0
215992 미니 에웨감성 좋네요 [6] file Magyarország 24.07.10 1029 6
215991 미니 디멘시티 9300 태블릿들 살까 생각해봤는데 치명적인 문제가 있군요. [6] RuBisCO 24.07.10 1175 7
215990 음향 솔직히 무선 이어폰은 애플도 가방이 잘 안되는 시장이니... [7] 에피 24.07.10 1088 1
215989 미니 이어폰 [1] peekaboob 24.07.10 266 1
215988 음향 버즈3 프로 혜택포함 22만원이면 괜찮은듯 싶네요 [10] Angry 24.07.09 1674 4
215987 미니 TWS 무선이어폰 제작기술의 난이도는 어느정도일까요 [6] 212212 24.07.09 678 1
215986 미니 [란즈크] 갤럭시Z폴드6 초반 판매량 분석 및 마케팅 강화 내용 정리 노다 24.07.09 1047 2
215985 미니 폴드6 플립6 사전예약 혜택 유출 [10] file 노다 24.07.09 1937 3

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...