로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

BarryWhite

소식 삼성 온디바이스 AI 실시간 번역 기술 개발자 인터뷰

갤럭시 AI가 지원되는 모바일 기기만 있다면 더 많은 나라에서 언어 장벽 없이 자유로운 소통을 누릴 수 있다. 갤럭시 AI의 ‘온디바이스 AI 실시간 통번역’의 지원 언어가 13개에서 16개로 확대되었기 때문이다. 새롭게 추가된 언어는 아랍어, 인도네시아어, 러시아어 등 총 3개이다.

 

통화 중 실시간 통번역뿐 아니라 다양한 애플리케이션에서 사용할 수 있는 갤럭시 AI 번역 기능은 삼성리서치가 오랜 기간 번역 데이터를 축적하고 AI 기술 노하우를 집약, MX사업부 개발실과 함께 고도화하여 탄생시킨 혁신 기술이다.

 

온디바이스 AI 번역 기능을 개발한 삼성리서치 글로벌 AI센터 (왼쪽부터) 최윤정, 유용현 프로

▲ 온디바이스 AI 번역 기능을 개발한 삼성리서치 글로벌 AI센터 (왼쪽부터) 최윤정, 유용현 프로

 

온디바이스 AI 기능으로 “개인정보 노출 걱정 없이 마음껏 소통해요”

갤럭시 AI의 실시간 통번역은 ‘온디바이스 AI’ 기능이라는 점이 가장 큰 특징이다. 온디바이스 AI는 외부 서버나 클라우드의 자원을 이용하는 방식이 아니라, 기기 자체의 자원만 이용해 서비스를 제공한다. 번역을 위해서 사용자가 입력한 데이터가 외부 서버로 전송되지 않기 때문에 개인정보 노출을 걱정할 필요가 없다.

 

삼성리서치 글로벌 AI센터는 자체 개발한 AI 번역 모델에 독자적인 기술을 더해서 온디바이스 AI 모델을 상용화하는 데 기여했다.

 

삼성리서치 연구팀과 MX사업부 개발팀은 많은 애플리케이션 사용 시나리오를 구상한 후, 이를 기반으로 필요한 데이터를 확보했다고 한다. 프로젝트 리더인 최윤정 프로는 “통화 중 실시간 통역 기능을 위해 구어체 데이터 수집에 힘썼고, 여행 중 유용하게 활용될 통역 앱 개발을 위해 여행 관련 데이터도 모았다”고 설명했다. 이어 “정확한 번역 기능을 제공하기 위해 채팅에 자주 쓰이는 신조어, 웹 브라우저에서 사용되는 html 태그 등 다양한 사례를 연구했다”고 덧붙였다.

 

온디바이스 AI 번역 기능 활용 사례. ① 통화 중 실시간 통역, ② 문자·채팅 대화 번역, ③ 노트 앱 번역, ④ 웹 브라우저 번역

▲ 온디바이스 AI 번역 기능 활용 사례. ① 통화 중 실시간 통역, ② 문자·채팅 대화 번역, ③ 노트 앱 번역, ④ 웹 브라우저 번역

 

삼성리서치의 노력으로 발전한 AI 번역 모델… “아이 키우듯 성장시켰죠”

삼성리서치 연구팀의 AI 번역 모델은 데이터로부터 스스로 학습하는 딥러닝(deep learning) 기술을 기반으로 한다. AI 연구 및 개발 담당 유용현 프로는 딥러닝 과정을 ‘아이 키우기’와 비슷하다고 설명했다. 유 프로는 “아이를 바르게 키우기 위해 좋은 교육 자료와 양육자가 필요하듯, 고성능의 AI 번역 모델을 만들기 위해서도 양질의 언어 데이터와 AI를 올바르게 학습시키는 연구원의 역량이 중요하다”고 강조했다.

 

삼성리서치는 양질의 데이터와 AI 학습을 위한 전문가를 모두 보유하고 있다. 2013년부터 사내 번역 서비스를 제공하면서 AI 번역에 대한 연구 개발을 지속적으로 진행해 왔고, 양질의 데이터도 꾸준히 축적해 왔다.

 

AI 학습은 딥러닝 분야 전문가로 구성된 삼성리서치 연구원들이 중요한 역할을 했다. 유 프로는 “연구 개발 과정에서 AI 번역 결과의 품질이 좋지 않으면, 문제를 파악하고 개선해야 한다. 연구원의 역량과 경험이 부족하면 문제의 원인을 찾는 데 오랜 시간이 걸리고, 해결 방안을 찾지 못할 수도 있다. 우리 연구원들은 전문성과 노하우를 활용하여 문제의 원인을 분석하고, 개선하는 과정을 빠르게 수행할 수 있다”라고 자부심을 내비쳤다.

 

AI 번역 모델의 번역 성능은 어떻게 검증할까. 삼성리서치 연구팀은 AI 번역 모델의 성능 검증을 위해서 테스트 세트 기반의 정량 평가와 번역사를 통한 정성 평가를, MX사업부 개발실에서는 다양한 테스트 세트를 구성하여 정성 평가를 진행하고 있다.

 

또한 세계적 권위의 기계번역 대회에 출전하며 외부 검증도 받고 있다. 유 프로는 “대회 출전에는 많은 시간과 준비가 필요하지만, 대회에서 우수한 성적을 거두는 것도 연구 개발의 원동력이 될 수 있다 ”며 “팀원 모두가 자유로운 분위기로 토론하고 다양한 아이디어를 시도하면서 좋은 성적을 거둘 수 있었다”고 말했다.

 

존댓말, 성조, 문장 기호 등… “언어마다 다른 특징도 세심하게 이해했죠”

언어마다 존댓말, 성조, 문장 기호 등 그 문화에만 통용되는 다양한 특징들이 있다. AI 실시간 통번역 기능은 언어적 특징을 최대한 고려해 번역의 완성도를 높였다. 예를 들어, 한국어와 일본어처럼 존댓말이 있는 언어는 통역 시 존댓말로 번역하도록 학습시킨 것이다.

 

해당 언어와 문화를 잘 이해하고 있는 해외 현지 연구소와의 협업도 동시에 진행했다. 최윤정 프로는 “해외 연구소의 연구원, 언어전문가와 긴밀하게 협력하면서, 번역의 완성도를 높일 수 있었다”고 말했다.

 

각국의 다양한 언어를 다루기 때문에 종종 시행착오도 따랐다. 최 프로는 “베트남어는 성조가 있는데, 사용자들이 채팅에서 일상 대화를 할 땐 성조를 생략하는 경우가 많다는 것을 알게 되어 성조가 없는 문장도 번역되게끔 데이터를 추가 구축했다”고 일화를 소개했다. 또한 문장 부호가 없는 태국어를 위한 별도의 문장 분리기를 개발하는 등 삼성리서치 연구팀은 AI 번역 모델의 성능을 향상하고자 세심한 노력을 기울였다.

 

온디바이스 AI 적용 비결? “가볍게 만드는 ‘경량화’ 기술 덕분이죠”

Teacher모델 지식 전이 증류 지식 전이 Student 모델 데이터

 

삼성리서치는 2019년부터 ‘온디바이스 AI 모델’ 개발을 시작했다. 유용현 프로는 “온디바이스 AI 모델은 서버 기반 AI 모델과 다르게 사용자의 기기만 이용하여 구동되기 때문에 적은 양의 연산 및 메모리 자원으로도 실행할 수 있도록 모델의 사이즈를 줄이는 경량화 기술이 가장 중요하다”고 강조했다. AI 모델 경량화를 위해서 ‘지식 증류(Knowledge Distillation) 방식’과 ‘양자화(Quantization)’ 기술을 활용했다.

 

지식 증류는 성능이 좋지만 모델 사이즈가 큰 Teacher 모델로부터 핵심 지식을 뽑아내어 작은 Student 모델로 전달하는 방식이다. 선생님이 일목요연하게 정리한 내용으로 학생이 공부하면 쉽게 이해할 수 있을 뿐만 아니라 효율적으로 공부할 수 있는 것과 비슷하다.

 

실제 딸기 사진(매우 많은 색상 정보) 양자화 녹색과 빨간색으로 그린 딸기(최소한의 색상 정보)

 

양자화 기술은 AI 알고리즘을 단순화하여 모델 크기를 줄이고 연산 과정을 효율화하여 응답 속도를 높이는 기술이다. 유 프로는 양자화 기술을 ‘딸기 그리기’에 비유했다. “딸기를 실제와 동일하게 그리기 위해서는 사실상 무수히 많은 색상 정보가 필요하지만 빨간색, 녹색처럼 간단한 색상으로도 표현할 수 있다”며 “양자화는 딸기를 그릴 때 필요한 색의 수를 최소화하면서 실제와 가깝게 그리도록 노력하는 과정”이라고 쉽게 설명했다.

 

지식 증류 방식과 양자화 개념은 AI 모델 경량화에서 잘 알려진 방식이지만, 연구원마다 세부적인 실험 방식이나 요소들이 모두 다르기 때문에 상용화 수준으로 구현하는 것은 결코 쉽지 않다. 삼성리서치 연구팀은 효율적인 양자화 방식을 찾고 속도 개선 알고리즘을 개발하며 이를 독자적인 기술로 발전시켰다. 최 프로는 “우리도 다양한 실험과 연구를 통해서 가장 적절한 경량화 방법을 찾아냈다”고 말했다.

 

고품질 AI 번역 모델을 압축한 경량화 모델에 응답 속도를 빠르게 만드는 알고리즘까지 적용해 가볍고 빠른 온디바이스 AI 번역 기능이 마침내 탄생한 것이다.

 

“언어를 넘어 문화를 이해하는 완벽한 번역기를 만드는 것이 목표”

온디바이스 AI 분야를 선도하고 있는 삼성리서치 글로벌 AI센터 연구원들의 목표는 무엇일까. 최윤정 프로는 “외국인과 소통할 때 어떠한 거슬림도 없이 매끄럽고 편리하게 대화하도록 돕는 것이 최종 목표”라고 말했다. 유 프로는 완벽한 번역기를 향한 꿈과 열정을 밝혔다. 그는 “언어를 넘어 문화를 이해하고 지식을 갖춘 완벽한 번역기가 언젠가 개발될 것”이라며 “세상에 아직 등장하지 않은 고도화된 번역기를 만드는 데 도전하고 싶다”는 당찬 포부를 드러냈다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
댓글
5
polorbear
1등 polorbear
2024.04.27. 01:34

구글껄 자들이 한것처럼 포정하는건...쫌... 

양심이 없는건가..

[polorbear]님의 댓글을 신고합니다. 취소 신고
BarryWhite
글쓴이
best BarryWhite polorbear 님께
2024.04.27. 01:43

근데 자료 읽어보면 번역은 구글게 아니라 그냥 삼성 리서치에서 연구개발한 것 같읍니다.

2013년부터 사내에서 번역 서비스를 썼다고 하니.

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
Vㅔ리굿
best Vㅔ리굿 polorbear 님께
2024.04.27. 02:10

언어쪽은 삼성 자체일거에요

[Vㅔ리굿]님의 댓글을 신고합니다. 취소 신고
마일로스
마일로스 polorbear 님께
2024.04.27. 09:59

자체 개발이고, 덕분에 on device로 제공하고 있죠

[마일로스]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 19.11.15 9 49117
핫글 소식 위기감 고조되는 알뜰폰업계…'번호이동 수수료' 타격 불가피 new aleji 24.05.07 3 323
핫글 소식 카카오페이, 1분기 영업손실 났지만 당기순이익 흑자전환 뉴스봇 24.05.07 1 251
핫글 소식 로욜 파산심사 신청 [3] update BarryWhite 24.05.07 1 534
58098 소식 비트코인, 7만 2,000달러 돌파...암호화폐 상장지수상품 승인 덕 BarryWhite 24.03.12 0 198
58097 소식 애플, 제3자 앱 스토어 허용...수수료 정책에 비판 빗발 [4] BarryWhite 24.03.11 5 680
58096 소식 엔비디아의 AI 지배력: 2026년까지 1,300억 달러 매출 예상 BarryWhite 24.03.11 0 252
58095 소식 퀄컴, 3월 18일 새 스냅드래곤 칩셋 공개 BarryWhite 24.03.11 0 298
58094 소식 삼성 갤럭시 북 4 엣지, 스냅드래곤 X 엘리트 탑재...M 시리즈 맥북 경쟁 BarryWhite 24.03.11 0 243
58093 소식 JEDEC, 2024Q3까지 차세대 LPDDR6 메모리 표준 확정 BarryWhite 24.03.11 0 161
58092 소식 국내 배터리 업계, 중국 맞서 신기술로 반격 [1] BarryWhite 24.03.11 1 302
58091 소식 낸드의 봄 앞당겨지나…삼성전자 中시안팹 가동률 70%대 회복 BarryWhite 24.03.11 0 322
58090 소식 네이버페이, 얼굴인식 결제 서비스 페이스사인 결제 상용화 BarryWhite 24.03.11 2 363
58089 소식 저커버그: 비전 프로보다 메타 퀘스트3가 더 좋다 BarryWhite 24.03.11 1 236
58088 소식 LG AI연구원-잭슨랩, 알츠하이머와 암 위한 AI 개발 파트너십 체결 BarryWhite 24.03.11 0 88
58087 소식 리뷰 : 벤큐 아이디어캠 S1 프로 "여러 모로 편리한 다재다능 웹캠" 뉴스봇 24.03.11 0 133
58086 소식 퀄컴 스냅 8 Gen4, 애플 A18 칩 능가? [4] BarryWhite 24.03.11 2 846
58085 소식 애플 워치OS 10.4 출시…고스트 터치 버그 수정 BarryWhite 24.03.11 0 270
58084 소식 애플 의존도 역풍…LG이노텍, 해외생산 늘리나 BarryWhite 24.03.11 0 181
58083 소식 구글 픽셀 8a 존재 확인, 개선된 배터리 정보 페이지도 제공될 것 BarryWhite 24.03.11 0 129
58082 소식 TSMC, 일본 파운드리 2공장 공식화 BarryWhite 24.03.11 0 156
58081 소식 인텔 코어 i9-14900KS 출시, 3월 14일 확정? BarryWhite 24.03.11 0 100
58080 소식 인텔 루나 레이크, 메테오 레이크 대비 50% 멀티 향상 BarryWhite 24.03.11 0 197
58079 소식 엔비디아 RTX 20 및 GTX 16, 비공식 리사이저블 BAR 지원 BarryWhite 24.03.11 0 166
58078 소식 “AI가 만든 프롬프트가 일관적인 결과 도출에 더 효과적” VM웨어 연구 뉴스봇 24.03.11 0 196
58077 소식 "벤치마크가 말해준다" 아직 PCIe 5.0 SSD가 사치인 이유 뉴스봇 24.03.11 0 151
58076 소식 삼성디스플레이, IT용 8세대 OLED 설비 반입식 개최..."2026년 양산" 뉴스봇 24.03.10 0 494
58075 소식 국제우주정거장 폐기 배터리, 곧 지구로 떨어진다 BarryWhite 24.03.10 1 499
58074 소식 M3 맥북 에어, 듀얼 낸드 플래시...전작 대비 SSD 속도 향상 BarryWhite 24.03.10 0 299
58073 소식 PS5 프로 성능, 기본 모델 대비 두배 향상 X BarryWhite 24.03.10 0 494
58072 소식 M3 맥북 에어, M3 맥북 프로 대비 고온 및 성능 저하 [5] BarryWhite 24.03.10 2 671
58071 소식 삼성, 갤럭시S 시리즈용 미디어텍 디멘시티 9000 고려 BarryWhite 24.03.10 1 558
58070 소식 갤럭시S23 시리즈, 이달 안에 S24 기능 쓴다 BarryWhite 24.03.10 0 569
58069 소식 RTX 50 블랙웰, 에이다와 유사한 메모리 구성 유지 [1] BarryWhite 24.03.10 0 335

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...