로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

BarryWhite

소식 구글, LLM에 무한한 컨텍스트창 가능...논문 발표

벤처비트는 구글 연구원들이 새 논문을 발표, 대규모 언어 모델(LLM)에 무한의 길이로 텍스트를 작업할 수 있는 기능을 제공한다고 보도했습니다.

 

이 논문에서는 메모리와 컴퓨팅 요구 사항을 일정하게 유지하면서 '컨텍스트(맥락) 창'을 확장하는 방식으로 언어 모델을 구성하는 기술인 Infini-attention을 소개합니다.

 

"이 연구에서는 트랜스포머 기반 대규모 언어 모델(LLM)을 제한된 메모리와 연산으로 무한히 긴 입력으로 확장하는 효율적인 방법을 소개합니다.

 

우리가 제안한 접근 방식의 핵심 구성 요소는 Infini-attention이라는 새로운 주의 기법입니다. Infini-attention은 바닐라 주의 메커니즘에 압축 메모리를 통합하고 단일 Transformer 블록에 마스크된 로컬 주의와 장기 선형 주의 메커니즘을 모두 구축합니다.

 

긴 컨텍스트 언어 모델링 벤치마크, 1M 시퀀스 길이의 패스키 컨텍스트 블록 검색, 1B 및 8B LLM을 사용한 500K 길이의 책 요약 작업에서 접근 방식의 효과를 입증합니다. 우리의 접근 방식은 최소한의 제한된 메모리 매개변수를 도입하고 LLM에 대한 빠른 스트리밍 추론을 가능하게 합니다."

 

구글 연구팀이 보고한 실험에 따르면 Infini-attention을 사용하는 모델은 추가 메모리 없이도 100만 토큰 이상 품질을 유지할 수 있는 것으로 나타났습니다. 이론적으로는 동일한 추세를 더 큰 길이로 지속할 수 있습니다.

 

컨텍스트 창은 모델이 언제든지 작업할 수 있는 토큰의 수입니다. 예를 들어 ChatGPT와의 대화가 컨텍스트 창을 넘어 확장되면 성능이 급격히 떨어지고 대화 시작 시 포함된 토큰을 버립니다.

 

조직은 프롬프트에 맞춤형 문서와 지식을 삽입하여 애플리케이션에 맞게 LLM을 사용자 정의하고 있습니다. 따라서 컨텍스트 길이를 늘리는 것은 모델을 개선하고 경쟁사보다 우위를 점하기 위한 주요 노력 중 하나입니다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다.
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 19.11.15 9 49318
핫글 소식 삼성 갤럭시 언팩 2024 초대장: Galaxy AI is Here [7] BarryWhite 24.06.26 4 586
핫글 소식 애플 마이크로 LED 개발 중단에 울고 웃은 대만 디스플레이 산업 [1] new 뉴스봇 24.06.26 1 354
핫글 소식 “뇌와 컴퓨터, 무한한 가능성의 연결고리” BCI 개발 동향과 과제 – Tech Report 뉴스봇 24.06.26 1 130
49212 소식 카카오모빌리티 로봇 배송 서비스 ‘브링’, 핵심은 개방과 확장이다 뉴스봇 24.04.23 0 74
49211 소식 IGN x ID@Xbox 디지털 쇼케이스, 4월 29일 개최 file BarryWhite 24.04.23 0 87
49210 소식 소니 독점 헬다이버즈2, 엑스박스 출시 고려 중? file BarryWhite 24.04.23 0 126
49209 소식 AMD, 5월말 라데온 스택 오픈소스화 시작 file BarryWhite 24.04.23 0 118
49208 소식 애플, AI 및 컴퓨터 비전 기업 데이터칼랩 인수 BarryWhite 24.04.23 0 146
49207 소식 삼성 갤럭시 링 크기에 따른 모델 번호 [2] file BarryWhite 24.04.22 0 88
49206 소식 SKT, 전 세계 이통사 중 AI 역량 1위 file BarryWhite 24.04.22 0 207
49205 소식 美 강력 제재 불구 화웨이 최신 스마트폰 품절 BarryWhite 24.04.22 0 200
49204 소식 MS, AI 협력 위해 삼성·하닉 등 초청 BarryWhite 24.04.22 0 37
49203 소식 [인터뷰] 강남언니, 일본에서 터진 비결 뉴스봇 24.04.22 0 393
49202 소식 삼성 계열사 내 '신기술 소자개발총괄' 필요성 커진다 뉴스봇 24.04.22 0 311
49201 소식 온플법 왜 그렇게 반대 많았나? 작년 발의안 평가 중 ‘최저’ 뉴스봇 24.04.22 0 180
49200 소식 “운영 비용 85% 절감 기대…” 마이크로소프트, 국내 AI 트랜스포메이션 사례 공개 뉴스봇 24.04.22 0 198
49199 소식 아마존서 신형 아이패드 에어 케이스 등장 file BarryWhite 24.04.22 0 85
49198 소식 무라타, LoRaWAN-위성통신 지원 가능 통신 모듈 개발 file BarryWhite 24.04.22 0 99
49197 소식 티맥스소프트, SaaS 미들웨어 ‘TSP’로 SMB 공략 나선다 뉴스봇 24.04.22 0 117
49196 소식 오픈소스 프로젝트에 코드를 업스트리밍하는 방법 뉴스봇 24.04.22 0 116
49195 소식 현대차, 재생에너지로 미국 EV 신공장 운영 BarryWhite 24.04.22 0 128
49194 소식 2024년 A18 칩의 청사진…얼마나 똑똑해질까? 뉴스봇 24.04.22 0 281
49193 소식 아카마이, 비디오 처리에 특화된 GPU 기반 인프라 서비스 출시 뉴스봇 24.04.22 0 116
49192 소식 “PC 성능 못지않게 중요한 것” 게이밍 헤드셋을 평가하는 6단계 뉴스봇 24.04.22 0 215
49191 소식 내 아이클라우드 계정에 로그인한 모든 기기를 확인하는 방법 뉴스봇 24.04.22 0 143
49190 소식 인텔 13ㆍ14세대 CPU 충돌 문제 ‘임시’ 해결책 뉴스봇 24.04.22 0 209
49189 소식 애플, 오프라인 온디바이스 AI 개발 중? 아이폰 탑재 전망 BarryWhite 24.04.22 0 152
49188 소식 [커머스BN] MCN들이 실패한 커머스, 틱톡 공식 MCN 순이엔티는 왜 도전하나(feat.틱톡샵) 뉴스봇 24.04.22 0 72
49187 소식 5년간 검색량 160% 늘어난 이것…뜨거운 인기에 관련 범죄 피해 속출 뉴스봇 24.04.22 0 230
49186 소식 엔비디아 CEO "TSMC가 가장 가까운 파트너" 뉴스봇 24.04.22 0 309
49185 소식 KT, 3대 AI 전력 절감 기술 공개 BarryWhite 24.04.22 0 104
49184 소식 LG전자, 2024년도연구/전문위원선발 BarryWhite 24.04.22 0 81
49183 소식 안드로이드 15, 보안과 가시성에 중점 둔 베타 버전 공개 뉴스봇 24.04.22 0 117

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...