로그인 해주세요.

미니기기 / 음향 게시판 *스마트폰과 PC, 카메라, 스피커 등 IT 미니기기와 음향기기에 관해 교류하는 게시판입니다.

십사프로씁니다

미니 결국 AI 모델도 폰노이만 구조를 따라가네요

제목은 조금 설레발입니다

유튜브에서 재밌는 영상을 봐서 여기에 요약해봅니다.

 

출처: 

https://youtu.be/qoKggLbjkGU?si=CwacrCIrz9MTS2m0

 

-----------------------------------------------------------------------------------

 

구글에서 차세대 AI 모델인 Titans를 공개했는데요

이는 기존의 트랜스포머 구조 이후의 혁신적인 접근법을 제공합니다.

 

트랜스포머 구조는 아래와 같습니다.

image.png

첫번째 공간에 단어가 적히면, 다음 공간에 올 가장 높은 확률의 단어를 깔고

첫번재, 두번째 공간의 단어를 이용해서 세번째 공간에 올 가장 높은 확률의 단어를 깔고

첫번째, 두번째, 세번째 공간의 단어를 이용해서 네번째 공간에 올 가장 높은 확률의 단어를 깔고...

(반복)

 

이때 한번에 처리할 수 있는 토큰(단어와 비슷)의 수를 Context Window라고 부릅니다. 한국어로는 맥락 윈도우? 라고 할 수 있겠네요.

 

예를들어 Context Window가 100개의 토큰을 처리할 수 있으면 200개의 토큰길이의 단어를 넣으면

AI 모델은 200개 토큰 길이의 말의 전체 맥락을 이해할 수 없는 '구조적인 문제'가 있습니다.

 

즉 긴 문장의 맥락 파악도 어렵고, 반대로 '장기 기억(과거 데이터 상실 = Context Window가 부족하기 때문)' 하는데에도 굉장히 취약한 구조를 갖고있습니다.

이 한계를 돌파하고자 Context window를 구글에서는 엄청나게 늘리고 했지만, 결국 근본적인 해결은 못하고 있는 상황이고, 너무나 많은 GPU가 동시에 작동해야하고 하드웨어끼리의 Latency 등등의 발생으로 현실적으로 활용하기 어려워지고 있죠.

이게 트랜스포머 모델의 태생적 한계라고 합니다.

 

하지만 구글의 차세대 AI 모델 Titans은 이 구조를 해결하기 위해서 새롭게 고안되었다고 합니다.

아래의 사진은 폰노이만 아키텍쳐인데요

 

image.png

 

폰노이만 아키텍쳐는 CPU 내부에서(Register, SRAM 등) 자주 쓰는 것들을 올려다놓고 바로바로 활용하고

그 이상의 용량 중 빠르게 활용해야 하는 것들은 RAM에 올려놓고 활용하고

그것보다 중요하지 않은 내용들은 SSD나 HDD에 저장해놓고 있습니다.

 

기존의 트랜스포머 모델은 CPU 내부에서만 모든것을 처리하려하는 것과 같습니다.

 

이 구조에서 착안하여 Titans은 장기 기억을 할 수 있는, '메모리 공간' 개념을 도입했습니다.

Neural Memory 라고 부릅니다

장기 기억을 할 수 있는 어떤 독립적인 공간, Context를 넘어가더라도 기억이 필요한 내용.

사람이 공부해서 기억을 하는것과 비슷하다고 할 수 있습니다.

 

문제는 Neural Memory가 너무 비대해지면, 결국 메모리를 제외한 일반 트랜스포머 모델 부분의 성능이 저하될 가능성이 있습니다. 아무거나 저장하면 오히려 안좋을 수 있다는 거죠.

그럼 핵심은 여기에 있습니다. "어떤 것을 Neural Memory에 저장해야하는가?"

 

여기서 구글은 Surprise Metric을 Neural Memory에 저장한다고 합니다.

 

"예상한 값"과 "실제 값"의 차이가 큰 것들의 경우 Surprise Metric으로써 Neural Memory에 저장한다고 합니다.

사람도 비슷하죠. 예상한 결과와 실제 결과가 다를때 놀라움을 느끼는데, 이러한 기억은 강하게 저장됩니다.

근데 신기하게 여기서 망각 매커니즘도 넣었다고 하네요. 중요한 데이터를 저장하며, 불필요한 정보는 지우면서 어댑티브하게 작동한다고 합니다.

 

image.png

 

구글에서 밝힌 결과를 보면 입력단 Length가 길어져도 Titans는 정확도를 여전히 높게 가져가는걸 볼 수 있습니다.

(웃긴건10^3에서 GPT-4가 Titans(MAC)보다 좋네요 ㅋㅋ)

 

 

아무튼 그렇습니다.

 

구글에서 트랜스포머 모델의 태생적 한계를 돌파하고자 내놓은 Titans 모델을 보면

결국 폰노이만 아키텍쳐를 따라 Memory 개념을 도입하는군요.

 

폰 노이만 그는....!

댓글
11
함우
1등 함우
2025.01.20. 23:49

기존 뉴럴 구조는 memory hierarchy를 따르지 않았나요? DRAM용량이 중요하다길래 스토리지까지는 아니어도 메인메모리는 적극적으로 사용할줄 알았는데..

[함우]님의 댓글을 신고합니다. 취소 신고
Eomjunsik
Eomjunsik 함우 님께
2025.01.21. 00:00

DRAM은 스왑 느낌으로 끌어다 쓰는 정도이고 모델 파라미터 전체를 VRAM에 올려놓는게 기본입니다.

따라서 context window가 증가함에 따라 VRAM 요구량이 같이 증가하는 문제가 있죠.

[Eomjunsik]님의 댓글을 신고합니다. 취소 신고
Oxc.suga
best 2등 Oxc.suga
2025.01.21. 00:17

아직 AI 분야는 아키텍쳐 구축에 인력(상상력이죠 사실상)이 들어갈 여지가 많이 보여서 즐겁습니다.

난해하지만, 이해하려고 시도해보면 재미있네요.

---

토큰 처리(정보 흐름)에 있어 논리적 계층을 도입하고자 하는게 Titan 모델의 논점인 듯 하네요. 그리고, 이 부분에 있어 폰노이만 계통 컴퓨터와 유사점이 있다는 논지로 들립니다.

이 점에선, 그럼에도 아직 갈 길이 멀어보이네요. 최적화할 여지가 많겠죠, 아무래도.

그러나, 미래만 보자면 context 증가에 비해 성능 낙폭이 적은 게 핵심적인 포인트일테고요.

[Oxc.suga]님의 댓글을 신고합니다. 취소 신고
살살녹는동파육
3등 살살녹는동파육
2025.01.21. 00:27

그래프에 따라 범례 달라지는거 최악이네요...ㅋㅋㅋㅋㅋ

[살살녹는동파육]님의 댓글을 신고합니다. 취소 신고
에이비12
에이비12
2025.01.21. 07:10

양질의 정보 너무 감사합니다~

[에이비12]님의 댓글을 신고합니다. 취소 신고
하루옹
하루옹
2025.01.21. 08:59

구글의 Titans은 가장 근접하게 사람의 뇌를 모사하는 수준까지 온거네요.

장기 기억과 망각이라니 정말 터미네이터의 스카이넷이 조만간 나오겠네요......ㄷㄷㄷ

[하루옹]님의 댓글을 신고합니다. 취소 신고
쌍피ㄷㄷ
2025.01.21. 10:32

사실 읽어보면서 본질적으로 기존의 RNN이나 LSTM과 좀더 유사한 개념이지 않냐는 생각이 들더라고요. 어떻게 보면 RNN이나 LSTM도 결국 기존 MLP에서 시퀀셜 정보를 처리하기에 한계가 왔을 때 제안된 방법이라, 타이탄도 트랜스포머로 시퀀셜 정보를 처리하기에 한계가 왔다는 신호로 받아들일 수 있지 않을까 싶기도 함다

[쌍피ㄷㄷ]님의 댓글을 신고합니다. 취소 신고
RuBisCO
RuBisCO
2025.01.21. 11:27

이제 VRAM 용량 작은 친구들도 끌려가는 미래가 보이는군요.

[RuBisCO]님의 댓글을 신고합니다. 취소 신고
나르자
나르자
2025.01.21. 12:35

망각메커니즘이 핵심 요소가 될거 같은데 말이죠

[나르자]님의 댓글을 신고합니다. 취소 신고
TODO
TODO
2025.01.21. 14:16

결국 AI는 사람을 탐구하고 시뮬레이팅 하면서 발전해 가는 것 같네요.

참 신기하네요.

[TODO]님의 댓글을 신고합니다. 취소 신고
noop
noop
2025.01.21. 15:11

Transformer 자체도 Turing Complete 하다는 얘기가 있어요.

[noop]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 공지 사이트 이용 수칙 241018 수정 file admin 18.08.04 123115 13
핫글 미니 갤럭시 S25+ 후기 [10] file 샐리 25.02.08 895 19
핫글 미니 S25 와서 사실 제일 크게 체감되는 부분은 [7] 212212 25.02.08 969 12
핫글 미니 반년을 괴롭히던 맥북 배터리 드레인 드디어 원인 찾았습니다... [11] update Stellist 25.02.08 555 12
224029 미니 se4에 다이나믹 아일랜드 루머가 있군요. [10] 아재건달_보노뭘보노 25.01.21 607 1
224028 미니 갤럭시북5프로360 와버렸습니다 [4] file 만두궁물 25.01.21 424 6
224027 미니 포토샵이 점점 비싸져가니 대체제들이 고개를 드네요 [22] Alternative 25.01.21 861 3
224026 미니 S25 울트라 색깔 뭐하실건가요. [7] 푹스 25.01.21 553 1
224025 미니 제발 s25 플러스에도 와이파이7이 들어가기를.. 올챙떡국 25.01.21 201 1
224024 미니 애플워치는 왜 폰 사용중 알림 받는 기능이 없는지... [7] Stellist 25.01.21 506 1
224023 미니 X Elite 오라이온 코어 전성비 [10] file WayBack 25.01.21 757 3
224022 미니 잡담: (블로그발) 점점 어질어질해지는 X시리즈 네이밍 [14] file Section31 25.01.21 965 1
224021 미니 P자 카메라 섬 없는 케이스 추천받습니다 [4] 코러스 25.01.21 375 0
224020 미니 샀슈 [2] file Mjay 25.01.21 302 5
224019 미니 s22u 강화유리 추천받습니다 [3] 코러스 25.01.21 214 0
224018 미니 유플은 핸드폰에 쉐어링심 넣어서 사용 불가군요 도나쓰 25.01.21 345 0
224017 미니 혈당 측정 워치 기대했는대 아쉽네요 [4] file 김치피자탕수육이좋다 25.01.20 822 2
미니 결국 AI 모델도 폰노이만 구조를 따라가네요 [11] file 십사프로씁니다 25.01.20 1910 17
224015 미니 어그로]512+12GB or 512+16GB 논란을 끝낼 방법을 알아왔습니다! [9] file 미코한량 25.01.20 1006 7
224014 미니 미밴드9프로 존버단 선생님들 계십니까? [15] file 빅코 25.01.20 588 4
224013 미니 이쯤에서 막 던져보는 25U 16G 모델 [3] 불펌냥이 25.01.20 818 0
224012 미니 호오 모토레이저 40 울트라..안드15 올라왔네요 ㅋ [1] file 스퀴니 25.01.20 480 6
224011 미니 슬림을 기다려야겠습니다 [13] 오리제 25.01.20 940 4
224010 미니 옆동네삼성지인발피셜 국내 512기가도 16기가램확정설? [5] S27울트라존버 25.01.20 1890 14
224009 미니 오늘 업뎃된 코레일톡 표 캡처방지 기능 근황...ios [7] file aleji 25.01.20 1532 3
224008 미니 여행가서 아이폰쓰니 좋았던 점 [31] file 행복한쿼카 25.01.20 1792 18
224007 미니 S25U 1TB 16기가램이 아시아 한정이라니 [성공]함께크는성장 25.01.20 620 0
224006 미니 16GB for Asians only [13] file iceuniverse 25.01.20 2103 28
224005 미니 에이설마 한국에도 16+512있겠죠... [7] S27울트라존버 25.01.20 758 6

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.