로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

BarryWhite

소식 구글, LLM에 무한한 컨텍스트창 가능...논문 발표

벤처비트는 구글 연구원들이 새 논문을 발표, 대규모 언어 모델(LLM)에 무한의 길이로 텍스트를 작업할 수 있는 기능을 제공한다고 보도했습니다.

 

이 논문에서는 메모리와 컴퓨팅 요구 사항을 일정하게 유지하면서 '컨텍스트(맥락) 창'을 확장하는 방식으로 언어 모델을 구성하는 기술인 Infini-attention을 소개합니다.

 

"이 연구에서는 트랜스포머 기반 대규모 언어 모델(LLM)을 제한된 메모리와 연산으로 무한히 긴 입력으로 확장하는 효율적인 방법을 소개합니다.

 

우리가 제안한 접근 방식의 핵심 구성 요소는 Infini-attention이라는 새로운 주의 기법입니다. Infini-attention은 바닐라 주의 메커니즘에 압축 메모리를 통합하고 단일 Transformer 블록에 마스크된 로컬 주의와 장기 선형 주의 메커니즘을 모두 구축합니다.

 

긴 컨텍스트 언어 모델링 벤치마크, 1M 시퀀스 길이의 패스키 컨텍스트 블록 검색, 1B 및 8B LLM을 사용한 500K 길이의 책 요약 작업에서 접근 방식의 효과를 입증합니다. 우리의 접근 방식은 최소한의 제한된 메모리 매개변수를 도입하고 LLM에 대한 빠른 스트리밍 추론을 가능하게 합니다."

 

구글 연구팀이 보고한 실험에 따르면 Infini-attention을 사용하는 모델은 추가 메모리 없이도 100만 토큰 이상 품질을 유지할 수 있는 것으로 나타났습니다. 이론적으로는 동일한 추세를 더 큰 길이로 지속할 수 있습니다.

 

컨텍스트 창은 모델이 언제든지 작업할 수 있는 토큰의 수입니다. 예를 들어 ChatGPT와의 대화가 컨텍스트 창을 넘어 확장되면 성능이 급격히 떨어지고 대화 시작 시 포함된 토큰을 버립니다.

 

조직은 프롬프트에 맞춤형 문서와 지식을 삽입하여 애플리케이션에 맞게 LLM을 사용자 정의하고 있습니다. 따라서 컨텍스트 길이를 늘리는 것은 모델을 개선하고 경쟁사보다 우위를 점하기 위한 주요 노력 중 하나입니다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다😘
🥇소식게 수호자🥇미게 지박령🥉큰게 좋아🥇미코의 잡담왕🥈유게 공무원🥉할인 경보📝게시판 소유자✨️🥉에로게 심심이
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 19.11.15 9 51273
핫글 소식 美싱크탱크 "삼성D-BOE 소송서 美 정부기관 삼성D 지원" 제안 new 뉴스봇 24.09.27 3 310
핫글 소식 "AR 글래스가 스마트폰 대체"…마크 저커버그의 자신감 [2] new 뉴스봇 24.09.27 3 194
핫글 소식 LG디스플레이, CSOT에 中광저우 LCD 공장 매각...2조원 [2] update 뉴스봇 24.09.27 2 260
46989 소식 애플TV플러스, 넷플릭스처럼 광고 도입하나 BarryWhite 24.07.29 0 92
46988 소식 오픈AI, 챗GPT 때문에 파산할 수도? [4] BarryWhite 24.07.29 0 410
46987 소식 [핫겜BN] 넥슨 마비노기 ‘갓경훈’을 만났다 [1] 뉴스봇 24.07.29 0 141
46986 소식 삼성 '갤럭시Z 폴드6 슬림' 테스트...10월 출시 뉴스봇 24.07.29 0 461
46985 소식 "부 과시 지쳤다" 인플루언서 마케팅 옛말…이젠 '이것'이 쇼핑 대세 [2] 뉴스봇 24.07.29 0 342
46984 소식 틱톡, 흥얼거려도 노래·영상 찾아주는 '사운드 검색' 기능 도입 뉴스봇 24.07.29 0 78
46983 소식 구글, 네스트 '차고 문 감지' 기능 도입…보안 강화 뉴스봇 24.07.29 0 105
46982 소식 블로그 | 직접 경험하지 않으면 모르는 비전 프로의 '불편한 짜릿함' 뉴스봇 24.07.29 0 110
46981 소식 연일 터지는 보안 사고…안티바이러스 소프트웨어를 점검할 때 뉴스봇 24.07.29 0 167
46980 소식 깃허브서 보안 부팅 암호화 키 유출…델, 에이서, 인텔 등 200여 가지 모델에 영향 뉴스봇 24.07.29 0 211
46979 소식 "데이터옵스 성숙도 높은 기업일수록 혼합형 접근 방식 채택" BMC 보고서 뉴스봇 24.07.29 0 105
46978 소식 구영배 큐텐 대표 “큐텐 지분 전체 걸고 피해 회복 최우선” 첫 입장 [1] 뉴스봇 24.07.29 1 509
46977 소식 일론 머스크, 스스로 트위터 규정 어기고 선거 관련 AI 영상 공유해 [3] file Stellist 24.07.29 2 639
46976 소식 [바스리] 센티미터 단위로 선수 움직임 추적한다, 핏투게더 뉴스봇 24.07.29 0 167
46975 소식 규제서 진흥 기조로? 대륙 스케일 ‘차이나조이 2024’ 뉴스봇 24.07.29 0 134
46974 소식 애플 인텔리전스, iOS 18.1 베타서 공개 전망? [1] BarryWhite 24.07.29 0 439
46973 소식 AMD 라이젠 9000 시리즈 출시 연기, 원인은 라벨링 오류? BarryWhite 24.07.29 0 113
46972 소식 에이수스 젠북 S16 리뷰: AMD 라이젠 AI 9 HX 370 테스트 [1] file BarryWhite 24.07.29 1 473
46971 소식 애플, 차량 앞유리에 사이드미러 영상 투사하는 특허 공개 file BarryWhite 24.07.29 0 115
46970 소식 MIT, 차세대 트랜지스터 개발...나노초 속도로 스위칭 BarryWhite 24.07.29 0 52
46969 소식 구글, 픽셀 버즈 프로2 가격 인상 예고 BarryWhite 24.07.29 0 353
46968 소식 판매자들 “티메프, 나스닥 간다고 무리한 프로모션” [1] 뉴스봇 24.07.28 2 850
46967 소식 '서브컬처'에 눈독 들이는 중견 게임사들...하반기 신작 러시 뉴스봇 24.07.28 0 368
46966 소식 카카오페이-NHN페이코, 티몬·위메프 결제 취소 관련 채널 운영 뉴스봇 24.07.28 0 262
46965 소식 알리익스프레스 "국내 첫 고객 간담회 개최" 뉴스봇 24.07.28 0 222
46964 소식 티몬·위메프, 현장 접수 피해자 대상 환불 속도 뉴스봇 24.07.28 0 182
46963 소식 삼성 갤럭시버즈3 한국 출시일, 8월 12일로 밀린 것으로 보여 [3] file Stellist 24.07.28 2 1130
46962 소식 구글이 투자한 ASTS, 저궤도 통신위성 5기 발사 준비완료 뉴스봇 24.07.28 0 249
46961 소식 美 법무부, "틱톡의 데이터 수집은 국가 안보 위협" [2] 뉴스봇 24.07.28 1 458
46960 소식 실내에서 즐기는 휴가...7월 넷째 주 PC-콘솔 할인 게임은 뉴스봇 24.07.28 0 161

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.