로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

BarryWhite

소식 삼성 온디바이스 AI 실시간 번역 기술 개발자 인터뷰

갤럭시 AI가 지원되는 모바일 기기만 있다면 더 많은 나라에서 언어 장벽 없이 자유로운 소통을 누릴 수 있다. 갤럭시 AI의 ‘온디바이스 AI 실시간 통번역’의 지원 언어가 13개에서 16개로 확대되었기 때문이다. 새롭게 추가된 언어는 아랍어, 인도네시아어, 러시아어 등 총 3개이다.

 

통화 중 실시간 통번역뿐 아니라 다양한 애플리케이션에서 사용할 수 있는 갤럭시 AI 번역 기능은 삼성리서치가 오랜 기간 번역 데이터를 축적하고 AI 기술 노하우를 집약, MX사업부 개발실과 함께 고도화하여 탄생시킨 혁신 기술이다.

 

온디바이스 AI 번역 기능을 개발한 삼성리서치 글로벌 AI센터 (왼쪽부터) 최윤정, 유용현 프로

▲ 온디바이스 AI 번역 기능을 개발한 삼성리서치 글로벌 AI센터 (왼쪽부터) 최윤정, 유용현 프로

 

온디바이스 AI 기능으로 “개인정보 노출 걱정 없이 마음껏 소통해요”

갤럭시 AI의 실시간 통번역은 ‘온디바이스 AI’ 기능이라는 점이 가장 큰 특징이다. 온디바이스 AI는 외부 서버나 클라우드의 자원을 이용하는 방식이 아니라, 기기 자체의 자원만 이용해 서비스를 제공한다. 번역을 위해서 사용자가 입력한 데이터가 외부 서버로 전송되지 않기 때문에 개인정보 노출을 걱정할 필요가 없다.

 

삼성리서치 글로벌 AI센터는 자체 개발한 AI 번역 모델에 독자적인 기술을 더해서 온디바이스 AI 모델을 상용화하는 데 기여했다.

 

삼성리서치 연구팀과 MX사업부 개발팀은 많은 애플리케이션 사용 시나리오를 구상한 후, 이를 기반으로 필요한 데이터를 확보했다고 한다. 프로젝트 리더인 최윤정 프로는 “통화 중 실시간 통역 기능을 위해 구어체 데이터 수집에 힘썼고, 여행 중 유용하게 활용될 통역 앱 개발을 위해 여행 관련 데이터도 모았다”고 설명했다. 이어 “정확한 번역 기능을 제공하기 위해 채팅에 자주 쓰이는 신조어, 웹 브라우저에서 사용되는 html 태그 등 다양한 사례를 연구했다”고 덧붙였다.

 

온디바이스 AI 번역 기능 활용 사례. ① 통화 중 실시간 통역, ② 문자·채팅 대화 번역, ③ 노트 앱 번역, ④ 웹 브라우저 번역

▲ 온디바이스 AI 번역 기능 활용 사례. ① 통화 중 실시간 통역, ② 문자·채팅 대화 번역, ③ 노트 앱 번역, ④ 웹 브라우저 번역

 

삼성리서치의 노력으로 발전한 AI 번역 모델… “아이 키우듯 성장시켰죠”

삼성리서치 연구팀의 AI 번역 모델은 데이터로부터 스스로 학습하는 딥러닝(deep learning) 기술을 기반으로 한다. AI 연구 및 개발 담당 유용현 프로는 딥러닝 과정을 ‘아이 키우기’와 비슷하다고 설명했다. 유 프로는 “아이를 바르게 키우기 위해 좋은 교육 자료와 양육자가 필요하듯, 고성능의 AI 번역 모델을 만들기 위해서도 양질의 언어 데이터와 AI를 올바르게 학습시키는 연구원의 역량이 중요하다”고 강조했다.

 

삼성리서치는 양질의 데이터와 AI 학습을 위한 전문가를 모두 보유하고 있다. 2013년부터 사내 번역 서비스를 제공하면서 AI 번역에 대한 연구 개발을 지속적으로 진행해 왔고, 양질의 데이터도 꾸준히 축적해 왔다.

 

AI 학습은 딥러닝 분야 전문가로 구성된 삼성리서치 연구원들이 중요한 역할을 했다. 유 프로는 “연구 개발 과정에서 AI 번역 결과의 품질이 좋지 않으면, 문제를 파악하고 개선해야 한다. 연구원의 역량과 경험이 부족하면 문제의 원인을 찾는 데 오랜 시간이 걸리고, 해결 방안을 찾지 못할 수도 있다. 우리 연구원들은 전문성과 노하우를 활용하여 문제의 원인을 분석하고, 개선하는 과정을 빠르게 수행할 수 있다”라고 자부심을 내비쳤다.

 

AI 번역 모델의 번역 성능은 어떻게 검증할까. 삼성리서치 연구팀은 AI 번역 모델의 성능 검증을 위해서 테스트 세트 기반의 정량 평가와 번역사를 통한 정성 평가를, MX사업부 개발실에서는 다양한 테스트 세트를 구성하여 정성 평가를 진행하고 있다.

 

또한 세계적 권위의 기계번역 대회에 출전하며 외부 검증도 받고 있다. 유 프로는 “대회 출전에는 많은 시간과 준비가 필요하지만, 대회에서 우수한 성적을 거두는 것도 연구 개발의 원동력이 될 수 있다 ”며 “팀원 모두가 자유로운 분위기로 토론하고 다양한 아이디어를 시도하면서 좋은 성적을 거둘 수 있었다”고 말했다.

 

존댓말, 성조, 문장 기호 등… “언어마다 다른 특징도 세심하게 이해했죠”

언어마다 존댓말, 성조, 문장 기호 등 그 문화에만 통용되는 다양한 특징들이 있다. AI 실시간 통번역 기능은 언어적 특징을 최대한 고려해 번역의 완성도를 높였다. 예를 들어, 한국어와 일본어처럼 존댓말이 있는 언어는 통역 시 존댓말로 번역하도록 학습시킨 것이다.

 

해당 언어와 문화를 잘 이해하고 있는 해외 현지 연구소와의 협업도 동시에 진행했다. 최윤정 프로는 “해외 연구소의 연구원, 언어전문가와 긴밀하게 협력하면서, 번역의 완성도를 높일 수 있었다”고 말했다.

 

각국의 다양한 언어를 다루기 때문에 종종 시행착오도 따랐다. 최 프로는 “베트남어는 성조가 있는데, 사용자들이 채팅에서 일상 대화를 할 땐 성조를 생략하는 경우가 많다는 것을 알게 되어 성조가 없는 문장도 번역되게끔 데이터를 추가 구축했다”고 일화를 소개했다. 또한 문장 부호가 없는 태국어를 위한 별도의 문장 분리기를 개발하는 등 삼성리서치 연구팀은 AI 번역 모델의 성능을 향상하고자 세심한 노력을 기울였다.

 

온디바이스 AI 적용 비결? “가볍게 만드는 ‘경량화’ 기술 덕분이죠”

Teacher모델 지식 전이 증류 지식 전이 Student 모델 데이터

 

삼성리서치는 2019년부터 ‘온디바이스 AI 모델’ 개발을 시작했다. 유용현 프로는 “온디바이스 AI 모델은 서버 기반 AI 모델과 다르게 사용자의 기기만 이용하여 구동되기 때문에 적은 양의 연산 및 메모리 자원으로도 실행할 수 있도록 모델의 사이즈를 줄이는 경량화 기술이 가장 중요하다”고 강조했다. AI 모델 경량화를 위해서 ‘지식 증류(Knowledge Distillation) 방식’과 ‘양자화(Quantization)’ 기술을 활용했다.

 

지식 증류는 성능이 좋지만 모델 사이즈가 큰 Teacher 모델로부터 핵심 지식을 뽑아내어 작은 Student 모델로 전달하는 방식이다. 선생님이 일목요연하게 정리한 내용으로 학생이 공부하면 쉽게 이해할 수 있을 뿐만 아니라 효율적으로 공부할 수 있는 것과 비슷하다.

 

실제 딸기 사진(매우 많은 색상 정보) 양자화 녹색과 빨간색으로 그린 딸기(최소한의 색상 정보)

 

양자화 기술은 AI 알고리즘을 단순화하여 모델 크기를 줄이고 연산 과정을 효율화하여 응답 속도를 높이는 기술이다. 유 프로는 양자화 기술을 ‘딸기 그리기’에 비유했다. “딸기를 실제와 동일하게 그리기 위해서는 사실상 무수히 많은 색상 정보가 필요하지만 빨간색, 녹색처럼 간단한 색상으로도 표현할 수 있다”며 “양자화는 딸기를 그릴 때 필요한 색의 수를 최소화하면서 실제와 가깝게 그리도록 노력하는 과정”이라고 쉽게 설명했다.

 

지식 증류 방식과 양자화 개념은 AI 모델 경량화에서 잘 알려진 방식이지만, 연구원마다 세부적인 실험 방식이나 요소들이 모두 다르기 때문에 상용화 수준으로 구현하는 것은 결코 쉽지 않다. 삼성리서치 연구팀은 효율적인 양자화 방식을 찾고 속도 개선 알고리즘을 개발하며 이를 독자적인 기술로 발전시켰다. 최 프로는 “우리도 다양한 실험과 연구를 통해서 가장 적절한 경량화 방법을 찾아냈다”고 말했다.

 

고품질 AI 번역 모델을 압축한 경량화 모델에 응답 속도를 빠르게 만드는 알고리즘까지 적용해 가볍고 빠른 온디바이스 AI 번역 기능이 마침내 탄생한 것이다.

 

“언어를 넘어 문화를 이해하는 완벽한 번역기를 만드는 것이 목표”

온디바이스 AI 분야를 선도하고 있는 삼성리서치 글로벌 AI센터 연구원들의 목표는 무엇일까. 최윤정 프로는 “외국인과 소통할 때 어떠한 거슬림도 없이 매끄럽고 편리하게 대화하도록 돕는 것이 최종 목표”라고 말했다. 유 프로는 완벽한 번역기를 향한 꿈과 열정을 밝혔다. 그는 “언어를 넘어 문화를 이해하고 지식을 갖춘 완벽한 번역기가 언젠가 개발될 것”이라며 “세상에 아직 등장하지 않은 고도화된 번역기를 만드는 데 도전하고 싶다”는 당찬 포부를 드러냈다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다.
댓글
5
polorbear
1등 polorbear
2024.04.27. 01:34

구글껄 자들이 한것처럼 포정하는건...쫌... 

양심이 없는건가..

[polorbear]님의 댓글을 신고합니다. 취소 신고
BarryWhite
글쓴이
best BarryWhite polorbear 님께
2024.04.27. 01:43

근데 자료 읽어보면 번역은 구글게 아니라 그냥 삼성 리서치에서 연구개발한 것 같읍니다.

2013년부터 사내에서 번역 서비스를 썼다고 하니.

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
Vㅔ리굿
best Vㅔ리굿 polorbear 님께
2024.04.27. 02:10

언어쪽은 삼성 자체일거에요

[Vㅔ리굿]님의 댓글을 신고합니다. 취소 신고
마일로스
마일로스 polorbear 님께
2024.04.27. 09:59

자체 개발이고, 덕분에 on device로 제공하고 있죠

[마일로스]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 19.11.15 9 49157
핫글 소식 구글: 왜 우리 AI 모델 이름이 제미니인가? [13] newfile BarryWhite 24.05.19 4 725
핫글 소식 화웨이, 인텔 칩 대체 위해 기린 9000C PC에 탑재...성능은 미공개 [7] newfile BarryWhite 24.05.19 2 383
핫글 소식 美, 中 태양광 철퇴 본격화…韓 기회 얻나 [4] update BarryWhite 24.05.19 1 335
60090 소식 애플페이 신규 서비스 지역 추가 [11] file sweat 22.03.17 13 5402
60089 소식 삼성폰, 보급형부터 프리미엄까지 모두 LG 배터리 쓴다 [4] 히타기새 22.06.03 10 4712
60088 소식 갤럭시워치, 애플 이어 '2위' 지켰다…아태지역서 인기에 출하량 50%↑ [8] 프로입털러 22.06.03 3 4363
60087 소식 '탈일본' 러시 불붙었다…日 스미토모, 한국서 반도체 EUV 포토레지스트 첫 출하 [뒷북비즈] [5] file Angry 22.06.04 12 4333
60086 소식 [루머] 갤럭시Z플립4 두께 및 무게 관련 내용 [7] 노다 22.06.03 0 4291
60085 소식 삼성 평택캠퍼스 'P5 증설' 임박했나..이사회, 반도체 투자 집중 논의 [2] 갤럭시Z플립4 22.06.04 1 4135
60084 소식 이재용의 "목숨 걸고"…거칠어진 한마디, 어쩌다 나왔나 [18] file S펜내장기원 22.05.29 14 3870
60083 소식 삼성 3나노 웨이퍼에 서명한 바이든…'반도체 동맹' 깊게 새겼다 [9] 프로입털러 22.05.20 10 3837
60082 소식 '테라 부활 계획' 제안한 권도형, "루나 안 팔았다…테라 생태계는 되살려야" [15] 프로입털러 22.05.14 2 3776
60081 소식 애플이 앱스토어 해킹 통계를 공개한 이유 뉴스봇 22.06.03 0 3762
60080 소식 "아이폰 사용자는 이미 쓰고 있다" 구글이 애플에서 베낀 신기능 5가지 [6] 뉴스봇 22.05.13 0 3734
60079 소식 테슬라, ‘AI 데이 2 ’9월 30일로 연기..’옵티머스’ 로봇 공개 기대감은 커져! 뉴스봇 22.06.03 1 3708
60078 소식 “이제 배달음식 안 먹어요” 이 정도일 줄이야…천하의 배민도 휘청 [16] aleji 22.05.23 19 3679
60077 소식 파이어폭스, iOS 17.4 이후 사용자 수 대폭 증가 [2] file Stellist 24.03.14 3 3657
60076 소식 한종희 삼성전자 부회장 “삼성만의 메타버스 만들 것” [7] 프로입털러 22.05.05 4 3648
60075 소식 TI, ‘시타라 AM62 프로세서’ 출시…“엣지 AI 접근성 향상되고 전력 소모량 줄여” 뉴스봇 22.06.03 0 3549
60074 소식 [단독] 이재용, 450조 투자에 "목숨 걸고 한다…앞만 보고 갈 것" [16] Aimyon 22.05.26 16 3548
60073 소식 티맥스-틸론, ‘개방형OS 공공 조달 총판 및 기술 지원 계약’ 체결 뉴스봇 22.06.03 0 3499
60072 소식 ASUS, 새 스마트폰 Zenfone 11 Ultra 발표 [2] file Stellist 24.03.15 3 3481
60071 소식 에픽게임즈, 명작 FPS 게임 울펜슈타인을 무료로 제공 file 뉴스봇 22.06.03 0 3461
60070 소식 삼성전자 "3나노 수율 잡았다"…파운드리도 주도권 [25] 노다 22.05.12 8 3433
60069 소식 삼성D, IT용 8.5세대 OLED 라인 월 15K 우선투자 가능성 뉴스봇 22.06.03 0 3384
60068 소식 [단독] 이재용, 평택공장서 바이든에게 직접 3나노 최신공정 소개 [13] aleji 22.05.19 14 3353
60067 소식 로켓배송, 드디어 돈벌기 시작했다 [7] 뉴스봇 22.05.13 5 3334
60066 소식 올해 스마트폰 출하량 13.6억대 전망…작년보다 3%↓ 프로입털러 22.06.03 0 3322
60065 소식 애플 페이 컨트리 리더 (한국&일본) 채용 공고 [11] file 프로입털러 22.06.05 11 3315
60064 소식 Astrohaus, 휴대용 문서작성기 Freewrite Alpha 발표 [4] file Stellist 23.12.28 3 3307
60063 소식 퀄컴 스냅드래곤8+ Gen1 벤치 (vs 갤S22U) [5] file Stellist 22.05.20 4 3307
60062 소식 애플, 아이폰 차별화 어려워져…기술 개발 AI로 투자 급선회 BarryWhite 24.03.14 2 3277

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...