로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

BarryWhite

소식 삼성 온디바이스 AI 실시간 번역 기술 개발자 인터뷰

갤럭시 AI가 지원되는 모바일 기기만 있다면 더 많은 나라에서 언어 장벽 없이 자유로운 소통을 누릴 수 있다. 갤럭시 AI의 ‘온디바이스 AI 실시간 통번역’의 지원 언어가 13개에서 16개로 확대되었기 때문이다. 새롭게 추가된 언어는 아랍어, 인도네시아어, 러시아어 등 총 3개이다.

 

통화 중 실시간 통번역뿐 아니라 다양한 애플리케이션에서 사용할 수 있는 갤럭시 AI 번역 기능은 삼성리서치가 오랜 기간 번역 데이터를 축적하고 AI 기술 노하우를 집약, MX사업부 개발실과 함께 고도화하여 탄생시킨 혁신 기술이다.

 

온디바이스 AI 번역 기능을 개발한 삼성리서치 글로벌 AI센터 (왼쪽부터) 최윤정, 유용현 프로

▲ 온디바이스 AI 번역 기능을 개발한 삼성리서치 글로벌 AI센터 (왼쪽부터) 최윤정, 유용현 프로

 

온디바이스 AI 기능으로 “개인정보 노출 걱정 없이 마음껏 소통해요”

갤럭시 AI의 실시간 통번역은 ‘온디바이스 AI’ 기능이라는 점이 가장 큰 특징이다. 온디바이스 AI는 외부 서버나 클라우드의 자원을 이용하는 방식이 아니라, 기기 자체의 자원만 이용해 서비스를 제공한다. 번역을 위해서 사용자가 입력한 데이터가 외부 서버로 전송되지 않기 때문에 개인정보 노출을 걱정할 필요가 없다.

 

삼성리서치 글로벌 AI센터는 자체 개발한 AI 번역 모델에 독자적인 기술을 더해서 온디바이스 AI 모델을 상용화하는 데 기여했다.

 

삼성리서치 연구팀과 MX사업부 개발팀은 많은 애플리케이션 사용 시나리오를 구상한 후, 이를 기반으로 필요한 데이터를 확보했다고 한다. 프로젝트 리더인 최윤정 프로는 “통화 중 실시간 통역 기능을 위해 구어체 데이터 수집에 힘썼고, 여행 중 유용하게 활용될 통역 앱 개발을 위해 여행 관련 데이터도 모았다”고 설명했다. 이어 “정확한 번역 기능을 제공하기 위해 채팅에 자주 쓰이는 신조어, 웹 브라우저에서 사용되는 html 태그 등 다양한 사례를 연구했다”고 덧붙였다.

 

온디바이스 AI 번역 기능 활용 사례. ① 통화 중 실시간 통역, ② 문자·채팅 대화 번역, ③ 노트 앱 번역, ④ 웹 브라우저 번역

▲ 온디바이스 AI 번역 기능 활용 사례. ① 통화 중 실시간 통역, ② 문자·채팅 대화 번역, ③ 노트 앱 번역, ④ 웹 브라우저 번역

 

삼성리서치의 노력으로 발전한 AI 번역 모델… “아이 키우듯 성장시켰죠”

삼성리서치 연구팀의 AI 번역 모델은 데이터로부터 스스로 학습하는 딥러닝(deep learning) 기술을 기반으로 한다. AI 연구 및 개발 담당 유용현 프로는 딥러닝 과정을 ‘아이 키우기’와 비슷하다고 설명했다. 유 프로는 “아이를 바르게 키우기 위해 좋은 교육 자료와 양육자가 필요하듯, 고성능의 AI 번역 모델을 만들기 위해서도 양질의 언어 데이터와 AI를 올바르게 학습시키는 연구원의 역량이 중요하다”고 강조했다.

 

삼성리서치는 양질의 데이터와 AI 학습을 위한 전문가를 모두 보유하고 있다. 2013년부터 사내 번역 서비스를 제공하면서 AI 번역에 대한 연구 개발을 지속적으로 진행해 왔고, 양질의 데이터도 꾸준히 축적해 왔다.

 

AI 학습은 딥러닝 분야 전문가로 구성된 삼성리서치 연구원들이 중요한 역할을 했다. 유 프로는 “연구 개발 과정에서 AI 번역 결과의 품질이 좋지 않으면, 문제를 파악하고 개선해야 한다. 연구원의 역량과 경험이 부족하면 문제의 원인을 찾는 데 오랜 시간이 걸리고, 해결 방안을 찾지 못할 수도 있다. 우리 연구원들은 전문성과 노하우를 활용하여 문제의 원인을 분석하고, 개선하는 과정을 빠르게 수행할 수 있다”라고 자부심을 내비쳤다.

 

AI 번역 모델의 번역 성능은 어떻게 검증할까. 삼성리서치 연구팀은 AI 번역 모델의 성능 검증을 위해서 테스트 세트 기반의 정량 평가와 번역사를 통한 정성 평가를, MX사업부 개발실에서는 다양한 테스트 세트를 구성하여 정성 평가를 진행하고 있다.

 

또한 세계적 권위의 기계번역 대회에 출전하며 외부 검증도 받고 있다. 유 프로는 “대회 출전에는 많은 시간과 준비가 필요하지만, 대회에서 우수한 성적을 거두는 것도 연구 개발의 원동력이 될 수 있다 ”며 “팀원 모두가 자유로운 분위기로 토론하고 다양한 아이디어를 시도하면서 좋은 성적을 거둘 수 있었다”고 말했다.

 

존댓말, 성조, 문장 기호 등… “언어마다 다른 특징도 세심하게 이해했죠”

언어마다 존댓말, 성조, 문장 기호 등 그 문화에만 통용되는 다양한 특징들이 있다. AI 실시간 통번역 기능은 언어적 특징을 최대한 고려해 번역의 완성도를 높였다. 예를 들어, 한국어와 일본어처럼 존댓말이 있는 언어는 통역 시 존댓말로 번역하도록 학습시킨 것이다.

 

해당 언어와 문화를 잘 이해하고 있는 해외 현지 연구소와의 협업도 동시에 진행했다. 최윤정 프로는 “해외 연구소의 연구원, 언어전문가와 긴밀하게 협력하면서, 번역의 완성도를 높일 수 있었다”고 말했다.

 

각국의 다양한 언어를 다루기 때문에 종종 시행착오도 따랐다. 최 프로는 “베트남어는 성조가 있는데, 사용자들이 채팅에서 일상 대화를 할 땐 성조를 생략하는 경우가 많다는 것을 알게 되어 성조가 없는 문장도 번역되게끔 데이터를 추가 구축했다”고 일화를 소개했다. 또한 문장 부호가 없는 태국어를 위한 별도의 문장 분리기를 개발하는 등 삼성리서치 연구팀은 AI 번역 모델의 성능을 향상하고자 세심한 노력을 기울였다.

 

온디바이스 AI 적용 비결? “가볍게 만드는 ‘경량화’ 기술 덕분이죠”

Teacher모델 지식 전이 증류 지식 전이 Student 모델 데이터

 

삼성리서치는 2019년부터 ‘온디바이스 AI 모델’ 개발을 시작했다. 유용현 프로는 “온디바이스 AI 모델은 서버 기반 AI 모델과 다르게 사용자의 기기만 이용하여 구동되기 때문에 적은 양의 연산 및 메모리 자원으로도 실행할 수 있도록 모델의 사이즈를 줄이는 경량화 기술이 가장 중요하다”고 강조했다. AI 모델 경량화를 위해서 ‘지식 증류(Knowledge Distillation) 방식’과 ‘양자화(Quantization)’ 기술을 활용했다.

 

지식 증류는 성능이 좋지만 모델 사이즈가 큰 Teacher 모델로부터 핵심 지식을 뽑아내어 작은 Student 모델로 전달하는 방식이다. 선생님이 일목요연하게 정리한 내용으로 학생이 공부하면 쉽게 이해할 수 있을 뿐만 아니라 효율적으로 공부할 수 있는 것과 비슷하다.

 

실제 딸기 사진(매우 많은 색상 정보) 양자화 녹색과 빨간색으로 그린 딸기(최소한의 색상 정보)

 

양자화 기술은 AI 알고리즘을 단순화하여 모델 크기를 줄이고 연산 과정을 효율화하여 응답 속도를 높이는 기술이다. 유 프로는 양자화 기술을 ‘딸기 그리기’에 비유했다. “딸기를 실제와 동일하게 그리기 위해서는 사실상 무수히 많은 색상 정보가 필요하지만 빨간색, 녹색처럼 간단한 색상으로도 표현할 수 있다”며 “양자화는 딸기를 그릴 때 필요한 색의 수를 최소화하면서 실제와 가깝게 그리도록 노력하는 과정”이라고 쉽게 설명했다.

 

지식 증류 방식과 양자화 개념은 AI 모델 경량화에서 잘 알려진 방식이지만, 연구원마다 세부적인 실험 방식이나 요소들이 모두 다르기 때문에 상용화 수준으로 구현하는 것은 결코 쉽지 않다. 삼성리서치 연구팀은 효율적인 양자화 방식을 찾고 속도 개선 알고리즘을 개발하며 이를 독자적인 기술로 발전시켰다. 최 프로는 “우리도 다양한 실험과 연구를 통해서 가장 적절한 경량화 방법을 찾아냈다”고 말했다.

 

고품질 AI 번역 모델을 압축한 경량화 모델에 응답 속도를 빠르게 만드는 알고리즘까지 적용해 가볍고 빠른 온디바이스 AI 번역 기능이 마침내 탄생한 것이다.

 

“언어를 넘어 문화를 이해하는 완벽한 번역기를 만드는 것이 목표”

온디바이스 AI 분야를 선도하고 있는 삼성리서치 글로벌 AI센터 연구원들의 목표는 무엇일까. 최윤정 프로는 “외국인과 소통할 때 어떠한 거슬림도 없이 매끄럽고 편리하게 대화하도록 돕는 것이 최종 목표”라고 말했다. 유 프로는 완벽한 번역기를 향한 꿈과 열정을 밝혔다. 그는 “언어를 넘어 문화를 이해하고 지식을 갖춘 완벽한 번역기가 언젠가 개발될 것”이라며 “세상에 아직 등장하지 않은 고도화된 번역기를 만드는 데 도전하고 싶다”는 당찬 포부를 드러냈다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다.
댓글
5
polorbear
1등 polorbear
2024.04.27. 01:34

구글껄 자들이 한것처럼 포정하는건...쫌... 

양심이 없는건가..

[polorbear]님의 댓글을 신고합니다. 취소 신고
BarryWhite
글쓴이
best BarryWhite polorbear 님께
2024.04.27. 01:43

근데 자료 읽어보면 번역은 구글게 아니라 그냥 삼성 리서치에서 연구개발한 것 같읍니다.

2013년부터 사내에서 번역 서비스를 썼다고 하니.

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
Vㅔ리굿
best Vㅔ리굿 polorbear 님께
2024.04.27. 02:10

언어쪽은 삼성 자체일거에요

[Vㅔ리굿]님의 댓글을 신고합니다. 취소 신고
마일로스
마일로스 polorbear 님께
2024.04.27. 09:59

자체 개발이고, 덕분에 on device로 제공하고 있죠

[마일로스]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 19.11.15 9 49146
핫글 소식 네이버, 라인야후 지분 매각 안 할 듯 [1] new 뉴스봇 19:30 4 368
핫글 소식 애플: 아이패드는 터치용, 맥은 아니야 [8] new BarryWhite 17:48 3 437
핫글 소식 생성형 AI 전략 확장하는 애플, 아이폰 시리의 챗GPT 지원 논의 [1] update 뉴스봇 10:30 1 182
56221 소식 레이저 바이퍼 미니 시그니쳐 에디션 공개 [5] file SpOpera 23.02.03 1 737
56220 소식 아이폰 SE4는 아이폰 XR과 비슷한 디자인으로 출시? [1] 뉴스봇 22.11.28 2 737
56219 “회의때 갤럭시·워치 두고 오세요” 캠페인 펼치는 삼성전자 [3] 프로입털러 22.09.27 1 737
56218 이재용 “다음달 손정의 회장 만나 ARM 인수 제안 들을 것” [1] 우주안녕 22.09.22 5 737
56217 소식 '라이트닝 없는 내일'을 준비하는 애플, USB-C 테스트 나섰다…블룸버그 뉴스봇 22.05.16 1 737
56216 소식 공개 임박한 '갤럭시S21 FE'… '아이폰13' 기선제압 나선다 [3] file 뉴스봇 21.08.29 3 737
56215 소식 엔비디아, 암(ARM) 인수 무산 '위기' [1] 뉴스봇 21.08.04 4 737
56214 소식 구글, 크롬 브라우저 새버전 공개..."23% 빨라졌다" 뉴스봇 21.05.30 3 737
56213 화웨이, 라이젠 16인치 노트북 MateBook 16 발표 [15] file Stellist 21.05.20 3 737
56212 20배 빠른 '진짜 5G' 물건너가나…정부 28㎓정책변경 기정사실화 [5] 프로입털러 21.05.10 2 737
56211 루머 : 원플러스 OnePlus 9 5G 유출 [10] file Stellist 20.12.12 1 737
56210 소식 삼성 갤럭시 S21 새 디자인 유출 file 뉴스봇 20.10.18 0 737
56209 소식 삼성전자, PC 신제품 ‘갤럭시 북 플렉스 알파’ 출시 [3] 프로 20.04.30 0 737
56208 소식 네이버페이, 모바일 교통카드 출시…이용 포인트 적립 예정 [6] file BarryWhite 24.05.13 7 736
56207 소식 도둑맞은 카드로 물건 샀는데‥나 몰라라 애플 매장 [5] BarryWhite 24.02.07 5 736
56206 소식 갤럭시S23 시리즈, 전작보다 판매량 23% 증가 [2] file Stellist 23.11.29 2 736
56205 소식 Honor, 가장 얇고 가벼운 폴드형 폴더블폰 Honor Magic V2 발표 [4] file Stellist 23.07.12 4 736
56204 목표주가 '십만전자'인데…삼전, 신저가에 근접(종합) [4] 프로입털러 22.04.06 1 736
56203 소식 "갤럭시S22용 반도체 AP, 아무 문제 없어" … 삼성전자 정면 반박 [4] 뉴스봇 22.02.16 0 736
56202 소식 뛰는 해커 위에 나는 FBI··· 애플 데이터 훔쳐낸 REvil 공격했다 뉴스봇 21.10.24 4 736
56201 소식 핀테크 서비스, 위법논란이 생긴 이유 뉴스봇 21.09.12 0 736
56200 KT인터넷 속도 저하 논란, 곧 판가름난다 [5] 프로입털러 21.07.19 5 736
56199 소식 삼성 갤럭시 폴드 라이트, 곧 출시되지 않아 [3] 뉴스봇 20.09.07 2 736
56198 소식 아이폰12 시리즈 9월 동시 출시 불가 전망 [2] BarryWhite 20.07.15 0 736
56197 소식 아이폰SE, 알림창에서 햅틱 터치 작동하지 않아 [6] file Stellist 20.04.28 0 736
56196 소식 “갤럭시 노트도 접을까?”...삼성 S펜 달린 폴더블폰 특허 [2] file 신규유저 20.03.21 0 736
56195 소식 델 스냅드래곤 X 엘리트 노트북 정보 등장 [2] file BarryWhite 24.05.11 5 735
56194 소식 삼성, 2nm 공정서 새 엑시노스 테스트 중 [1] BarryWhite 24.02.20 3 735
56193 소식 퀄컴: 韓, 28GHz 5G B2C 포기 예외적 상황…SA 전환 서둘러야 [2] BarryWhite 23.10.29 0 735
56192 소식 iPhone 14 라이브 클립 유출...새로운 듀얼 노치 file 뉴스봇 22.09.04 0 735

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...