로그인 해주세요.

AI / 로봇 게시판 *AI / 로봇에 관해 교류하는 게시판입니다.

BarryWhite

AI 카이스트, 스텔라트레인 기술 개발...저비용 GPU로 대규모 AI 모델 학습

images_000081_image1.jpg_11.jpg

images_000081_image2.jpg_9.jpg

images_000081_image3.jpg_3.jpg

images_000081_image4.jpg_1.jpg

 

 

카이스트 연구진이 고가의 데이터센터급 GPU나 고속 네트워크 없이도 AI 모델을 효율적으로 학습할 수 있는 기술을 개발했습니다. 이 기술을 통해 자원이 제한된 기업이나 연구자들이 AI 연구를 보다 효과적으로 수행할 수 있을 것으로 보입니다.

 

카이스트 대학 전기및전자공학부 한동수 교수 연구팀은 일반 소비자용 GPU를 활용, 네트워크 대역폭이 제한된 분산 환경에서도 AI 모델 학습을 수십에서 수백 배 가속할 수 있는 기술을 개발했다고 19일 밝혔습니다. 

 

기존에 AI 모델을 학습하기 위해서는 개당 수천만 원에 달하는 고성능 서버용 GPU(엔비디아 H100) 여러 대와 이들을 연결하기 위한 400Gbps급 고속 네트워크를 가진 고가 인프라가 필요했습니다.

 

한동수 교수 연구팀은 이를 개선하기 위해 '스텔라트레인(StellaTrain)'이라는 분산 학습 프레임워크를 개발했다고 전했습니다.

 

스텔라트레인은 고성능 H100에 비해 10~20배 저렴한 소비자용 GPU를 활용, 고속의 전용 네트워크 대신 대역폭이 수백에서 수천 배 낮은 일반 인터넷 환경에서도 효율적인 분산 학습을 가능하게 하는 기술입니다.

 

기존에는 저가 GPU를 사용할 경우, 작은 GPU 메모리와 네트워크 속도 제한으로 인해 대규모 AI 모델 학습 시 속도가 수백 배 느려지는 한계가 있었습니다. 하지만 연구팀이 개발한 스텔라트레인 기술은 CPU와 GPU를 병렬로 활용해 학습 속도를 높이고, 네트워크 속도에 맞춰 데이터를 효율적으로 압축 및 전송하는 알고리즘을 적용. 고속 네트워크 없이도 여러 대의 저가 GPU를 이용해 빠른 학습을 가능하게 했습니다. 

 

특히, 학습을 작업 단계별로 CPU와 GPU가 나누어 병렬적으로 처리할 수 있는 새로운 파이프라인 기술을 도입, 연산 자원의 효율을 극대화했습니다.

 

원거리 분산 환경에서도 GPU 연산 효율을 높이기 위해, AI 모델별 GPU 활용률을 실시간으로 모니터링해 모델이 학습하는 샘플의 개수(배치 크기)를 동적으로 결정하고, 변화하는 네트워크 대역폭에 맞추어 GPU 간의 데이터 전송을 효율화하는 기술도 개발한 것으로 알려졌습니다.

 

연구 결과, 스텔라트레인 기술 사용 시 기존 데이터 병렬 학습에 비해 최대 104배 빠른 성능을 낼 수 있는 것으로 나타났습니다. 

 

이 연구는 우리 대학 임휘준 박사, 예준철 박사과정 학생, UC 어바인의 산기타 압두 조시(Sangeetha Abdu Jyothi) 교수와 공동으로 진행됐으며, 연구 성과는 지난 8월 호주 시드니에서 열린 ACM SIGCOMM 2024에서 발표됐습니다.

 

한동수 교수 연구팀은 2024년 7월, GPU 메모리 한계를 극복해 소수의 GPU로 거대 언어 모델을 학습하는 새로운 기술을 발표하기도 했습니다. 해당 연구는 최신 거대 언어 모델의 기반이 되는 전문가 혼합형(Mixture of Expert) 모델을 제한된 메모리 환경에서도 효율적인 학습을 가능케 하는 기술입니다.

 

*

 

우오 짝짝짝.

 

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다😘
🥇소식게 수호자🥇미게 지박령🥉큰게 좋아🥇미코의 잡담왕🥈유게 공무원🥉할인 경보📝게시판 소유자✨️🥉에로게 심심이
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 AI AI / 로봇 게시판 이용 수칙 240418 [4] admin 24.04.18 3 261
37 AI 구글, 더 빨라진 제미니 1.5 플래시 공개 [2] BarryWhite 24.09.03 0 178
36 AI 구글, 직원 소통위한 AI 도입...오히려 소통 단절 비판 BarryWhite 24.09.03 0 103
35 AI 딥마인드, GenRM으로 LLM 정확성 향상...셀프 검증 BarryWhite 24.09.04 0 76
34 AI xAI, AI 학습 시스템 콜로서스 공개…엔비디아 공동 개발 BarryWhite 24.09.04 0 62
33 AI 두바이 피자 체인점, 챗GPT로 신메뉴 개발 성공 BarryWhite 24.09.04 0 151
32 로봇 새송이버섯 이용 바이오 하이브리드 로봇 개발 BarryWhite 24.09.04 2 128
31 AI 빌 게이츠, 가장 많이 쓰는 AI 공개 BarryWhite 24.09.06 1 327
30 AI 구글 제미니, 양식 작성 지원 기능 추가 BarryWhite 24.09.06 0 95
29 로봇 요기요, 자율주행 로봇배달 정식 런칭 [4] file BarryWhite 24.09.09 2 323
28 로봇 LG전자 이동형 AI홈 허브, IFA 최고 제품 선정 [2] BarryWhite 24.09.11 0 101
27 AI 어도비 파이어플라이, 비디오 생성 기능 추가 예정 BarryWhite 24.09.12 0 43
26 로봇 뉴로메카-조지아대, 의료용 AI 휴머노이드 개발 착수 BarryWhite 24.09.12 0 40
25 AI AI 가짜 논문, 구글 스콜라서 활개 [1] BarryWhite 24.09.13 1 187
24 AI 오늘 발표된 o1-preview 시연 영상 [2] file 숨겨진오징어 24.09.13 7 423
23 AI 구글, 안드용 AI 챗봇 제미니 라이브 출시...실시간 음성 대화 지원 BarryWhite 24.09.14 0 132
22 AI OpenAI가 고삐 풀겠다 선언했군요 [3] Stellist 24.09.16 7 1388
21 AI 앱 개발자·기업: 구글 제미니 쓰기 너무 어려웡! [2] BarryWhite 24.09.17 1 453
20 AI EA, 게임 개발 전반에 AI 적극 도입 발표 BarryWhite 24.09.18 0 62
19 AI AI가 인간보다 잘하는 것 BarryWhite 24.09.19 0 131
AI 카이스트, 스텔라트레인 기술 개발...저비용 GPU로 대규모 AI 모델 학습 BarryWhite 24.09.19 0 126
17 AI AI로 인한 일자리 감소 부정은 어리석은 짓 [2] BarryWhite 24.09.20 0 132
16 로봇 젠슨 황: 개인용 로봇, R2-D2 현실 될 것 file BarryWhite 24.09.20 0 116
15 AI 순다 피차이: AI는 인간 경쟁 아닌 협업 도구 [4] BarryWhite 24.09.22 2 216
14 AI 중동 자본, AI 스타트업 대규모 투자 BarryWhite 24.09.23 0 53
13 AI 샘 알트먼: 수천일 안에 인간 능가 초지능 출현 [1] BarryWhite 24.09.24 0 154

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.