로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

BarryWhite

소식 구글, LLM에 무한한 컨텍스트창 가능...논문 발표

벤처비트는 구글 연구원들이 새 논문을 발표, 대규모 언어 모델(LLM)에 무한의 길이로 텍스트를 작업할 수 있는 기능을 제공한다고 보도했습니다.

 

이 논문에서는 메모리와 컴퓨팅 요구 사항을 일정하게 유지하면서 '컨텍스트(맥락) 창'을 확장하는 방식으로 언어 모델을 구성하는 기술인 Infini-attention을 소개합니다.

 

"이 연구에서는 트랜스포머 기반 대규모 언어 모델(LLM)을 제한된 메모리와 연산으로 무한히 긴 입력으로 확장하는 효율적인 방법을 소개합니다.

 

우리가 제안한 접근 방식의 핵심 구성 요소는 Infini-attention이라는 새로운 주의 기법입니다. Infini-attention은 바닐라 주의 메커니즘에 압축 메모리를 통합하고 단일 Transformer 블록에 마스크된 로컬 주의와 장기 선형 주의 메커니즘을 모두 구축합니다.

 

긴 컨텍스트 언어 모델링 벤치마크, 1M 시퀀스 길이의 패스키 컨텍스트 블록 검색, 1B 및 8B LLM을 사용한 500K 길이의 책 요약 작업에서 접근 방식의 효과를 입증합니다. 우리의 접근 방식은 최소한의 제한된 메모리 매개변수를 도입하고 LLM에 대한 빠른 스트리밍 추론을 가능하게 합니다."

 

구글 연구팀이 보고한 실험에 따르면 Infini-attention을 사용하는 모델은 추가 메모리 없이도 100만 토큰 이상 품질을 유지할 수 있는 것으로 나타났습니다. 이론적으로는 동일한 추세를 더 큰 길이로 지속할 수 있습니다.

 

컨텍스트 창은 모델이 언제든지 작업할 수 있는 토큰의 수입니다. 예를 들어 ChatGPT와의 대화가 컨텍스트 창을 넘어 확장되면 성능이 급격히 떨어지고 대화 시작 시 포함된 토큰을 버립니다.

 

조직은 프롬프트에 맞춤형 문서와 지식을 삽입하여 애플리케이션에 맞게 LLM을 사용자 정의하고 있습니다. 따라서 컨텍스트 길이를 늘리는 것은 모델을 개선하고 경쟁사보다 우위를 점하기 위한 주요 노력 중 하나입니다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다.
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 19.11.15 9 49455
핫글 소식 새 갤럭시 한국이 제일 쌀 듯…첫 선 '링'은 49만원대 [2] new scjang01 07:41 4 622
핫글 소식 모바일 신분증, 재외국민도 이용 가능해져…LA·중국 등 시범사업 scjang01 02:17 1 225
2406 소식 前 플레이스테이션 수석 디렉터, 닌텐도로 이직 BarryWhite 24.04.13 0 40
2405 소식 中, 통신사의 AMD·인텔 칩 사용 중단 명령 BarryWhite 24.04.13 0 41
2404 소식 갤럭시 S22 시리즈, 플립/폴드4, 5월 원UI 6.1 및 갤럭시 AI 탑재 file BarryWhite 24.04.13 4 116
2403 소식 삼성전자, 신규 M&A 시작? 핵심인사 복귀 BarryWhite 24.04.13 1 95
2402 소식 EUV 칩 제조기업의 IT 시스템 사고...실제론 랜섬웨어 공격? BarryWhite 24.04.13 0 55
2401 소식 엔비디아: GPU VRAM 오류는 인텔 탓 BarryWhite 24.04.13 0 81
2400 소식 구글, 크롬 브라우저 유료 버전 출시 file BarryWhite 24.04.13 0 179
2399 소식 애플, 앱스토어 수수료 소송 기각 요청 거부당해 BarryWhite 24.04.13 3 88
2398 소식 애플, 또 맥북 8GB 통합램 옹호 BarryWhite 24.04.13 7 282
2397 소식 엔비디아, 중국 수출 제한탓 4090 RMA시 전액 환불 BarryWhite 24.04.13 0 126
2396 소식 삼성 290단 V-NAND 다음 달 출시...430단 낸드는 내년 출시? BarryWhite 24.04.13 2 195
2395 소식 OpenAI, 유료 구독자 전용 GPT-4 Turbo 출시 BarryWhite 24.04.13 2 277
2394 소식 애플·테슬라의 중국 대탈출… 이들이 새로 향한 곳은? BarryWhite 24.04.13 0 328
2393 소식 외계행성서 처음 관측된 글로리 현상은 무엇? file BarryWhite 24.04.13 1 323
2392 소식 도요타·소니 만들고 日정부 8조 투입 반도체 기업…美실리콘밸리서 애플·구글 공략 선언 [1] BarryWhite 24.04.13 1 405
2391 소식 아이폰SE4 : AI 사진 촬영기능, 야간모드 없음 BarryWhite 24.04.13 2 181
2390 소식 배터리 충전 필요없는 애플 펜슬 나올 수도...특허 출원 file BarryWhite 24.04.13 0 242
2389 소식 KT, ‘티빙+스타벅스’ OTT 구독팩 선봬 뉴스봇 24.04.14 0 112
2388 소식 LG에너지솔루션, 생성형 AI 기술 도입...연내 'AI 통합 플랫폼' 구축 계획 뉴스봇 24.04.14 0 73
2387 소식 日: 애플·구글 독점규제법안 마련, 위반시 과징금 매출액의 20% [1] BarryWhite 24.04.14 0 140
2386 소식 삼성전자서비스, AI 분석으로 가전 원격 상담 시작 BarryWhite 24.04.14 0 163
2385 소식 슬기랑 민지도 이거 쓴대…귀에 땀 찬다고 조롱받던 애플 헤드셋 깜짝 반전 [1] file BarryWhite 24.04.14 1 647
소식 구글, LLM에 무한한 컨텍스트창 가능...논문 발표 BarryWhite 24.04.14 0 54
2383 소식 샤오미 위협하는 극강 가성비...갤럭시 핏3 완판행렬 이유 [1] BarryWhite 24.04.14 0 397
2382 소식 삼성 HBM3E, AMD 뚫었다...시장 캐스팅보트 기대감↑ BarryWhite 24.04.14 1 399
2381 소식 네이버 검색, 생성형 AI 기술 적용 BarryWhite 24.04.14 0 194
2380 소식 애플, PFL 연구 위한 파이썬 프레임워크 개발...머신러닝 모델 공동 훈련 BarryWhite 24.04.14 0 30
2379 소식 마크 저커버그, 술에 취해 페북 콕 찔러보기 기능 떠올려 BarryWhite 24.04.14 0 117
2378 소식 짐 켈러: 엔비디아 블랙웰, 이더넷 사용했어야 BarryWhite 24.04.14 0 75
2377 소식 엑박 독점 게임이었던 씨오브시브즈, PS5 서버 마비시켜 BarryWhite 24.04.14 0 39

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...