로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

BarryWhite

소식 삼성 온디바이스 AI 실시간 번역 기술 개발자 인터뷰

갤럭시 AI가 지원되는 모바일 기기만 있다면 더 많은 나라에서 언어 장벽 없이 자유로운 소통을 누릴 수 있다. 갤럭시 AI의 ‘온디바이스 AI 실시간 통번역’의 지원 언어가 13개에서 16개로 확대되었기 때문이다. 새롭게 추가된 언어는 아랍어, 인도네시아어, 러시아어 등 총 3개이다.

 

통화 중 실시간 통번역뿐 아니라 다양한 애플리케이션에서 사용할 수 있는 갤럭시 AI 번역 기능은 삼성리서치가 오랜 기간 번역 데이터를 축적하고 AI 기술 노하우를 집약, MX사업부 개발실과 함께 고도화하여 탄생시킨 혁신 기술이다.

 

온디바이스 AI 번역 기능을 개발한 삼성리서치 글로벌 AI센터 (왼쪽부터) 최윤정, 유용현 프로

▲ 온디바이스 AI 번역 기능을 개발한 삼성리서치 글로벌 AI센터 (왼쪽부터) 최윤정, 유용현 프로

 

온디바이스 AI 기능으로 “개인정보 노출 걱정 없이 마음껏 소통해요”

갤럭시 AI의 실시간 통번역은 ‘온디바이스 AI’ 기능이라는 점이 가장 큰 특징이다. 온디바이스 AI는 외부 서버나 클라우드의 자원을 이용하는 방식이 아니라, 기기 자체의 자원만 이용해 서비스를 제공한다. 번역을 위해서 사용자가 입력한 데이터가 외부 서버로 전송되지 않기 때문에 개인정보 노출을 걱정할 필요가 없다.

 

삼성리서치 글로벌 AI센터는 자체 개발한 AI 번역 모델에 독자적인 기술을 더해서 온디바이스 AI 모델을 상용화하는 데 기여했다.

 

삼성리서치 연구팀과 MX사업부 개발팀은 많은 애플리케이션 사용 시나리오를 구상한 후, 이를 기반으로 필요한 데이터를 확보했다고 한다. 프로젝트 리더인 최윤정 프로는 “통화 중 실시간 통역 기능을 위해 구어체 데이터 수집에 힘썼고, 여행 중 유용하게 활용될 통역 앱 개발을 위해 여행 관련 데이터도 모았다”고 설명했다. 이어 “정확한 번역 기능을 제공하기 위해 채팅에 자주 쓰이는 신조어, 웹 브라우저에서 사용되는 html 태그 등 다양한 사례를 연구했다”고 덧붙였다.

 

온디바이스 AI 번역 기능 활용 사례. ① 통화 중 실시간 통역, ② 문자·채팅 대화 번역, ③ 노트 앱 번역, ④ 웹 브라우저 번역

▲ 온디바이스 AI 번역 기능 활용 사례. ① 통화 중 실시간 통역, ② 문자·채팅 대화 번역, ③ 노트 앱 번역, ④ 웹 브라우저 번역

 

삼성리서치의 노력으로 발전한 AI 번역 모델… “아이 키우듯 성장시켰죠”

삼성리서치 연구팀의 AI 번역 모델은 데이터로부터 스스로 학습하는 딥러닝(deep learning) 기술을 기반으로 한다. AI 연구 및 개발 담당 유용현 프로는 딥러닝 과정을 ‘아이 키우기’와 비슷하다고 설명했다. 유 프로는 “아이를 바르게 키우기 위해 좋은 교육 자료와 양육자가 필요하듯, 고성능의 AI 번역 모델을 만들기 위해서도 양질의 언어 데이터와 AI를 올바르게 학습시키는 연구원의 역량이 중요하다”고 강조했다.

 

삼성리서치는 양질의 데이터와 AI 학습을 위한 전문가를 모두 보유하고 있다. 2013년부터 사내 번역 서비스를 제공하면서 AI 번역에 대한 연구 개발을 지속적으로 진행해 왔고, 양질의 데이터도 꾸준히 축적해 왔다.

 

AI 학습은 딥러닝 분야 전문가로 구성된 삼성리서치 연구원들이 중요한 역할을 했다. 유 프로는 “연구 개발 과정에서 AI 번역 결과의 품질이 좋지 않으면, 문제를 파악하고 개선해야 한다. 연구원의 역량과 경험이 부족하면 문제의 원인을 찾는 데 오랜 시간이 걸리고, 해결 방안을 찾지 못할 수도 있다. 우리 연구원들은 전문성과 노하우를 활용하여 문제의 원인을 분석하고, 개선하는 과정을 빠르게 수행할 수 있다”라고 자부심을 내비쳤다.

 

AI 번역 모델의 번역 성능은 어떻게 검증할까. 삼성리서치 연구팀은 AI 번역 모델의 성능 검증을 위해서 테스트 세트 기반의 정량 평가와 번역사를 통한 정성 평가를, MX사업부 개발실에서는 다양한 테스트 세트를 구성하여 정성 평가를 진행하고 있다.

 

또한 세계적 권위의 기계번역 대회에 출전하며 외부 검증도 받고 있다. 유 프로는 “대회 출전에는 많은 시간과 준비가 필요하지만, 대회에서 우수한 성적을 거두는 것도 연구 개발의 원동력이 될 수 있다 ”며 “팀원 모두가 자유로운 분위기로 토론하고 다양한 아이디어를 시도하면서 좋은 성적을 거둘 수 있었다”고 말했다.

 

존댓말, 성조, 문장 기호 등… “언어마다 다른 특징도 세심하게 이해했죠”

언어마다 존댓말, 성조, 문장 기호 등 그 문화에만 통용되는 다양한 특징들이 있다. AI 실시간 통번역 기능은 언어적 특징을 최대한 고려해 번역의 완성도를 높였다. 예를 들어, 한국어와 일본어처럼 존댓말이 있는 언어는 통역 시 존댓말로 번역하도록 학습시킨 것이다.

 

해당 언어와 문화를 잘 이해하고 있는 해외 현지 연구소와의 협업도 동시에 진행했다. 최윤정 프로는 “해외 연구소의 연구원, 언어전문가와 긴밀하게 협력하면서, 번역의 완성도를 높일 수 있었다”고 말했다.

 

각국의 다양한 언어를 다루기 때문에 종종 시행착오도 따랐다. 최 프로는 “베트남어는 성조가 있는데, 사용자들이 채팅에서 일상 대화를 할 땐 성조를 생략하는 경우가 많다는 것을 알게 되어 성조가 없는 문장도 번역되게끔 데이터를 추가 구축했다”고 일화를 소개했다. 또한 문장 부호가 없는 태국어를 위한 별도의 문장 분리기를 개발하는 등 삼성리서치 연구팀은 AI 번역 모델의 성능을 향상하고자 세심한 노력을 기울였다.

 

온디바이스 AI 적용 비결? “가볍게 만드는 ‘경량화’ 기술 덕분이죠”

Teacher모델 지식 전이 증류 지식 전이 Student 모델 데이터

 

삼성리서치는 2019년부터 ‘온디바이스 AI 모델’ 개발을 시작했다. 유용현 프로는 “온디바이스 AI 모델은 서버 기반 AI 모델과 다르게 사용자의 기기만 이용하여 구동되기 때문에 적은 양의 연산 및 메모리 자원으로도 실행할 수 있도록 모델의 사이즈를 줄이는 경량화 기술이 가장 중요하다”고 강조했다. AI 모델 경량화를 위해서 ‘지식 증류(Knowledge Distillation) 방식’과 ‘양자화(Quantization)’ 기술을 활용했다.

 

지식 증류는 성능이 좋지만 모델 사이즈가 큰 Teacher 모델로부터 핵심 지식을 뽑아내어 작은 Student 모델로 전달하는 방식이다. 선생님이 일목요연하게 정리한 내용으로 학생이 공부하면 쉽게 이해할 수 있을 뿐만 아니라 효율적으로 공부할 수 있는 것과 비슷하다.

 

실제 딸기 사진(매우 많은 색상 정보) 양자화 녹색과 빨간색으로 그린 딸기(최소한의 색상 정보)

 

양자화 기술은 AI 알고리즘을 단순화하여 모델 크기를 줄이고 연산 과정을 효율화하여 응답 속도를 높이는 기술이다. 유 프로는 양자화 기술을 ‘딸기 그리기’에 비유했다. “딸기를 실제와 동일하게 그리기 위해서는 사실상 무수히 많은 색상 정보가 필요하지만 빨간색, 녹색처럼 간단한 색상으로도 표현할 수 있다”며 “양자화는 딸기를 그릴 때 필요한 색의 수를 최소화하면서 실제와 가깝게 그리도록 노력하는 과정”이라고 쉽게 설명했다.

 

지식 증류 방식과 양자화 개념은 AI 모델 경량화에서 잘 알려진 방식이지만, 연구원마다 세부적인 실험 방식이나 요소들이 모두 다르기 때문에 상용화 수준으로 구현하는 것은 결코 쉽지 않다. 삼성리서치 연구팀은 효율적인 양자화 방식을 찾고 속도 개선 알고리즘을 개발하며 이를 독자적인 기술로 발전시켰다. 최 프로는 “우리도 다양한 실험과 연구를 통해서 가장 적절한 경량화 방법을 찾아냈다”고 말했다.

 

고품질 AI 번역 모델을 압축한 경량화 모델에 응답 속도를 빠르게 만드는 알고리즘까지 적용해 가볍고 빠른 온디바이스 AI 번역 기능이 마침내 탄생한 것이다.

 

“언어를 넘어 문화를 이해하는 완벽한 번역기를 만드는 것이 목표”

온디바이스 AI 분야를 선도하고 있는 삼성리서치 글로벌 AI센터 연구원들의 목표는 무엇일까. 최윤정 프로는 “외국인과 소통할 때 어떠한 거슬림도 없이 매끄럽고 편리하게 대화하도록 돕는 것이 최종 목표”라고 말했다. 유 프로는 완벽한 번역기를 향한 꿈과 열정을 밝혔다. 그는 “언어를 넘어 문화를 이해하고 지식을 갖춘 완벽한 번역기가 언젠가 개발될 것”이라며 “세상에 아직 등장하지 않은 고도화된 번역기를 만드는 데 도전하고 싶다”는 당찬 포부를 드러냈다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다.
📝게시판 소유자(1)✨️🥇미게 지박령🥉미코의 심심이🥇미코의 잡담왕🥇소식게 수호자🥈유게 공무원🥉큰게 좋아🥉할인 경보
댓글
5
polorbear
1등 polorbear
2024.04.27. 01:34

구글껄 자들이 한것처럼 포정하는건...쫌... 

양심이 없는건가..

[polorbear]님의 댓글을 신고합니다. 취소 신고
BarryWhite
글쓴이
best BarryWhite polorbear 님께
2024.04.27. 01:43

근데 자료 읽어보면 번역은 구글게 아니라 그냥 삼성 리서치에서 연구개발한 것 같읍니다.

2013년부터 사내에서 번역 서비스를 썼다고 하니.

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
Vㅔ리굿
best Vㅔ리굿 polorbear 님께
2024.04.27. 02:10

언어쪽은 삼성 자체일거에요

[Vㅔ리굿]님의 댓글을 신고합니다. 취소 신고
마일로스
마일로스 polorbear 님께
2024.04.27. 09:59

자체 개발이고, 덕분에 on device로 제공하고 있죠

[마일로스]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 19.11.15 9 49544
핫글 소식 에픽, 삼성에 대한 항의로 갤럭시스토어에서 포트나이트 삭제 [1] file Stellist 24.07.26 2 676
2808 소식 갤럭시 Z 폴드 5, 스타일러스 펜 탑재하나...두께와 무게 증가 전망 [6] 뉴스봇 23.01.08 3 1048
2807 中의 알리바바 규제 본격화…사상 최대 벌금 폭탄 부과 [6] 뉴스봇 21.04.12 3 561
2806 “TV는 한국” 다시 증명…삼성전자 16년 연속 세계 1위, LG전자 점유율은 역대 최대 노태문 22.02.20 3 449
2805 화웨이, 앱갤러리 수수료 50% 요구 불발되어 텐센트 게임 삭제 [13] file Stellist 21.01.02 3 875
2804 소식 삼성전자, 단종 우려 씻고 하반기 '갤럭시S FE' 부활 [5] AlieNaTiZ 23.02.16 3 1314
2803 소식 “M365 코파일럿의 모든 것” MS의 생성형 AI 도구 종합 안내서 뉴스봇 23.07.14 3 302
2802 삼성, Diamond OLED 상표권 출원 [2] file Stellist 21.04.21 3 755
2801 소식 "갤럭시S24 AI 기능, 갤S23·갤Z폴드5·갤Z플립5에도 탑재" [2] aleji 24.01.11 3 1149
2800 中전력난에...애플 협력사들 공장 가동 일시 중단 [1] 프로입털러 21.09.27 3 478
2799 소식 SKT, 갤럭시S23 FE 출시 [2] BarryWhite 23.12.07 3 591
2798 루머 : 소니 무선이어폰 WF-LSN900 유출 [4] file Stellist 22.04.26 3 1254
2797 소식 뇌 임플란트·화성 이주용 스타십... 올해는 SF를 현실로 만든다 [1] BarryWhite 24.01.02 3 395
2796 소식 네이버 웹 브라우저 ‘웨일’ 점유율 9.4%로 역대 최고치 [11] file 뉴스봇 22.02.04 3 865
2795 소식 TSMC 한국인 임원, 인텔로 이직 [1] 뉴스봇 22.08.10 3 1051
2794 소식 손영권 삼성전자 CSO, 대만 기업과 밀월 BarryWhite 24.02.19 3 484
2793 소식 블루투스 3.0부터 최신 5.2 규격까지 16개 보안 취약점 발견 [2] 뉴스봇 21.09.06 3 764
2792 iOS 15, 아이폰 6s 및 아이폰 SE 지원 종료 예정 [10] file 프로입털러 21.01.22 3 930
2791 소식 韓 반도체 소부장, 美빅테크 뚫었다…애플 '비전 프로'향 단독 공급까지 [2] BarryWhite 23.06.20 3 561
2790 네이버, '혐오표현 제한' 규정 넣기로…"면피용" 비판 여전 [7] 프로입털러 21.12.12 3 953
2789 소식 팀 쿡, 애플 주식 약 20만 주 매각...약 1,640만 달러 수익 [4] BarryWhite 24.04.06 3 835
2788 소식 삼성 '갤럭시S21' 시리즈 인도 모델…스냅드래곤 8 1세대 탑재 [4] 뉴스봇 21.12.06 3 1032
2787 소식 아이스 유니버스: Galaxy S23 시리즈는 기본적으로 동일한 치수 [4] 뉴스봇 22.09.09 3 1793
2786 소식 틱톡 퇴출하려던 도널드 트럼프, 틱톡 계정 만들어 [3] file Stellist 24.06.03 3 601
2785 소식 애플, 영국서 특허 침해 항소심 패소...“4G 관련 특허 2건 침해” BarryWhite 23.07.05 3 260
2784 소식 삼성전자, 삼성 Z 폴드 상표 등록...폴더블 태블릿 준비 뉴스봇 21.04.25 3 633
2783 소식 2분기 세계 TV 시장...전체 1위 삼성전자, OLED 1위 LG전자 [1] 뉴스봇 23.08.21 3 701
2782 소식 삼성, 녹색줄 문제 갤럭시S21·S22 디스플레이 무상 교체 [2] file BarryWhite 24.04.21 3 306
2781 소식 짝퉁 대국 중국, 가짜 에어팟 무려 570억원이나… [10] 뉴스봇 21.07.19 3 844
2780 뉴욕, 지하철 내 휴대폰 중계기 설치사업 발표 [3] file Stellist 22.08.01 3 777
2779 외산 노트북 성공 전략 "성능은 기본, 서비스까지" [9] 갤럭시Z플립4 22.06.02 3 2111

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...