소식 구글, LLM에 무한한 컨텍스트창 가능...논문 발표

BarryWhite
조회 수 80
2024.04.14. 18:13

벤처비트는 구글 연구원들이 새 논문을 발표, 대규모 언어 모델(LLM)에 무한의 길이로 텍스트를 작업할 수 있는 기능을 제공한다고 보도했습니다.

이 논문에서는 메모리와 컴퓨팅 요구 사항을 일정하게 유지하면서 '컨텍스트(맥락) 창'을 확장하는 방식으로 언어 모델을 구성하는 기술인 Infini-attention을 소개합니다.

"이 연구에서는 트랜스포머 기반 대규모 언어 모델(LLM)을 제한된 메모리와 연산으로 무한히 긴 입력으로 확장하는 효율적인 방법을 소개합니다.

우리가 제안한 접근 방식의 핵심 구성 요소는 Infini-attention이라는 새로운 주의 기법입니다. Infini-attention은 바닐라 주의 메커니즘에 압축 메모리를 통합하고 단일 Transformer 블록에 마스크된 로컬 주의와 장기 선형 주의 메커니즘을 모두 구축합니다.

긴 컨텍스트 언어 모델링 벤치마크, 1M 시퀀스 길이의 패스키 컨텍스트 블록 검색, 1B 및 8B LLM을 사용한 500K 길이의 책 요약 작업에서 접근 방식의 효과를 입증합니다. 우리의 접근 방식은 최소한의 제한된 메모리 매개변수를 도입하고 LLM에 대한 빠른 스트리밍 추론을 가능하게 합니다."

구글 연구팀이 보고한 실험에 따르면 Infini-attention을 사용하는 모델은 추가 메모리 없이도 100만 토큰 이상 품질을 유지할 수 있는 것으로 나타났습니다. 이론적으로는 동일한 추세를 더 큰 길이로 지속할 수 있습니다.

컨텍스트 창은 모델이 언제든지 작업할 수 있는 토큰의 수입니다. 예를 들어 ChatGPT와의 대화가 컨텍스트 창을 넘어 확장되면 성능이 급격히 떨어지고 대화 시작 시 포함된 토큰을 버립니다.

조직은 프롬프트에 맞춤형 문서와 지식을 삽입하여 애플리케이션에 맞게 LLM을 사용자 정의하고 있습니다. 따라서 컨텍스트 길이를 늘리는 것은 모델을 개선하고 경쟁사보다 우위를 점하기 위한 주요 노력 중 하나입니다.

살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다😘

🥇소식게 수호자🥇미게 지박령🥉큰게 좋아🥇미코의 잡담왕🥈유게 공무원🥉할인 경보📝게시판 소유자✨️🥉에로게 심심이

에디터로 글쓰기

번호	분류	제목	글쓴이	날짜		조회 수
공지	소식	IT 소식 게시판 이용 수칙 230127	admin	19.11.15	9	51273
핫글	소식	美싱크탱크 "삼성D-BOE 소송서 美 정부기관 삼성D 지원" 제안	뉴스봇	24.09.27	3	310
핫글	소식	"AR 글래스가 스마트폰 대체"…마크 저커버그의 자신감 [2]	뉴스봇	24.09.27	3	194
핫글	소식	LG디스플레이, CSOT에 中광저우 LCD 공장 매각...2조원 [2]	뉴스봇	24.09.27	2	260
46989	소식	애플TV플러스, 넷플릭스처럼 광고 도입하나	BarryWhite	24.07.29	0	92
46988	소식	오픈AI, 챗GPT 때문에 파산할 수도? [4]	BarryWhite	24.07.29	0	410
46987	소식	[핫겜BN] 넥슨 마비노기 ‘갓경훈’을 만났다 [1]	뉴스봇	24.07.29	0	141
46986	소식	삼성 '갤럭시Z 폴드6 슬림' 테스트...10월 출시	뉴스봇	24.07.29	0	461
46985	소식	"부 과시 지쳤다" 인플루언서 마케팅 옛말…이젠 '이것'이 쇼핑 대세 [2]	뉴스봇	24.07.29	0	342
46984	소식	틱톡, 흥얼거려도 노래·영상 찾아주는 '사운드 검색' 기능 도입	뉴스봇	24.07.29	0	78
46983	소식	구글, 네스트 '차고 문 감지' 기능 도입…보안 강화	뉴스봇	24.07.29	0	105
46982	소식	블로그 \| 직접 경험하지 않으면 모르는 비전 프로의 '불편한 짜릿함'	뉴스봇	24.07.29	0	110
46981	소식	연일 터지는 보안 사고…안티바이러스 소프트웨어를 점검할 때	뉴스봇	24.07.29	0	167
46980	소식	깃허브서 보안 부팅 암호화 키 유출…델, 에이서, 인텔 등 200여 가지 모델에 영향	뉴스봇	24.07.29	0	211
46979	소식	"데이터옵스 성숙도 높은 기업일수록 혼합형 접근 방식 채택" BMC 보고서	뉴스봇	24.07.29	0	105
46978	소식	구영배 큐텐 대표 “큐텐 지분 전체 걸고 피해 회복 최우선” 첫 입장 [1]	뉴스봇	24.07.29	1	509
46977	소식	일론 머스크, 스스로 트위터 규정 어기고 선거 관련 AI 영상 공유해 [3]	Stellist	24.07.29	2	639
46976	소식	[바스리] 센티미터 단위로 선수 움직임 추적한다, 핏투게더	뉴스봇	24.07.29	0	167
46975	소식	규제서 진흥 기조로? 대륙 스케일 ‘차이나조이 2024’	뉴스봇	24.07.29	0	134
46974	소식	애플 인텔리전스, iOS 18.1 베타서 공개 전망? [1]	BarryWhite	24.07.29	0	439
46973	소식	AMD 라이젠 9000 시리즈 출시 연기, 원인은 라벨링 오류?	BarryWhite	24.07.29	0	113
46972	소식	에이수스 젠북 S16 리뷰: AMD 라이젠 AI 9 HX 370 테스트 [1]	BarryWhite	24.07.29	1	473
46971	소식	애플, 차량 앞유리에 사이드미러 영상 투사하는 특허 공개	BarryWhite	24.07.29	0	115
46970	소식	MIT, 차세대 트랜지스터 개발...나노초 속도로 스위칭	BarryWhite	24.07.29	0	52
46969	소식	구글, 픽셀 버즈 프로2 가격 인상 예고	BarryWhite	24.07.29	0	353
46968	소식	판매자들 “티메프, 나스닥 간다고 무리한 프로모션” [1]	뉴스봇	24.07.28	2	850
46967	소식	'서브컬처'에 눈독 들이는 중견 게임사들...하반기 신작 러시	뉴스봇	24.07.28	0	368
46966	소식	카카오페이-NHN페이코, 티몬·위메프 결제 취소 관련 채널 운영	뉴스봇	24.07.28	0	262
46965	소식	알리익스프레스 "국내 첫 고객 간담회 개최"	뉴스봇	24.07.28	0	222
46964	소식	티몬·위메프, 현장 접수 피해자 대상 환불 속도	뉴스봇	24.07.28	0	182
46963	소식	삼성 갤럭시버즈3 한국 출시일, 8월 12일로 밀린 것으로 보여 [3]	Stellist	24.07.28	2	1130
46962	소식	구글이 투자한 ASTS, 저궤도 통신위성 5기 발사 준비완료	뉴스봇	24.07.28	0	249
46961	소식	美 법무부, "틱톡의 데이터 수집은 국가 안보 위협" [2]	뉴스봇	24.07.28	1	458
46960	소식	실내에서 즐기는 휴가...7월 넷째 주 PC-콘솔 할인 게임은	뉴스봇	24.07.28	0	161

👨‍👩‍👧‍👦미코🌕

소식 구글, LLM에 무한한 컨텍스트창 가능...논문 발표

스킨 기본정보

확장 변수

1. 게시판 기본 설정

2. 글 목록

3. 갤러리 설정

4. 글 읽기 화면

5. 댓글 설정

6. 글 쓰기 화면 설정