로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

BarryWhite

소식 삼성 온디바이스 AI 실시간 번역 기술 개발자 인터뷰

갤럭시 AI가 지원되는 모바일 기기만 있다면 더 많은 나라에서 언어 장벽 없이 자유로운 소통을 누릴 수 있다. 갤럭시 AI의 ‘온디바이스 AI 실시간 통번역’의 지원 언어가 13개에서 16개로 확대되었기 때문이다. 새롭게 추가된 언어는 아랍어, 인도네시아어, 러시아어 등 총 3개이다.

 

통화 중 실시간 통번역뿐 아니라 다양한 애플리케이션에서 사용할 수 있는 갤럭시 AI 번역 기능은 삼성리서치가 오랜 기간 번역 데이터를 축적하고 AI 기술 노하우를 집약, MX사업부 개발실과 함께 고도화하여 탄생시킨 혁신 기술이다.

 

온디바이스 AI 번역 기능을 개발한 삼성리서치 글로벌 AI센터 (왼쪽부터) 최윤정, 유용현 프로

▲ 온디바이스 AI 번역 기능을 개발한 삼성리서치 글로벌 AI센터 (왼쪽부터) 최윤정, 유용현 프로

 

온디바이스 AI 기능으로 “개인정보 노출 걱정 없이 마음껏 소통해요”

갤럭시 AI의 실시간 통번역은 ‘온디바이스 AI’ 기능이라는 점이 가장 큰 특징이다. 온디바이스 AI는 외부 서버나 클라우드의 자원을 이용하는 방식이 아니라, 기기 자체의 자원만 이용해 서비스를 제공한다. 번역을 위해서 사용자가 입력한 데이터가 외부 서버로 전송되지 않기 때문에 개인정보 노출을 걱정할 필요가 없다.

 

삼성리서치 글로벌 AI센터는 자체 개발한 AI 번역 모델에 독자적인 기술을 더해서 온디바이스 AI 모델을 상용화하는 데 기여했다.

 

삼성리서치 연구팀과 MX사업부 개발팀은 많은 애플리케이션 사용 시나리오를 구상한 후, 이를 기반으로 필요한 데이터를 확보했다고 한다. 프로젝트 리더인 최윤정 프로는 “통화 중 실시간 통역 기능을 위해 구어체 데이터 수집에 힘썼고, 여행 중 유용하게 활용될 통역 앱 개발을 위해 여행 관련 데이터도 모았다”고 설명했다. 이어 “정확한 번역 기능을 제공하기 위해 채팅에 자주 쓰이는 신조어, 웹 브라우저에서 사용되는 html 태그 등 다양한 사례를 연구했다”고 덧붙였다.

 

온디바이스 AI 번역 기능 활용 사례. ① 통화 중 실시간 통역, ② 문자·채팅 대화 번역, ③ 노트 앱 번역, ④ 웹 브라우저 번역

▲ 온디바이스 AI 번역 기능 활용 사례. ① 통화 중 실시간 통역, ② 문자·채팅 대화 번역, ③ 노트 앱 번역, ④ 웹 브라우저 번역

 

삼성리서치의 노력으로 발전한 AI 번역 모델… “아이 키우듯 성장시켰죠”

삼성리서치 연구팀의 AI 번역 모델은 데이터로부터 스스로 학습하는 딥러닝(deep learning) 기술을 기반으로 한다. AI 연구 및 개발 담당 유용현 프로는 딥러닝 과정을 ‘아이 키우기’와 비슷하다고 설명했다. 유 프로는 “아이를 바르게 키우기 위해 좋은 교육 자료와 양육자가 필요하듯, 고성능의 AI 번역 모델을 만들기 위해서도 양질의 언어 데이터와 AI를 올바르게 학습시키는 연구원의 역량이 중요하다”고 강조했다.

 

삼성리서치는 양질의 데이터와 AI 학습을 위한 전문가를 모두 보유하고 있다. 2013년부터 사내 번역 서비스를 제공하면서 AI 번역에 대한 연구 개발을 지속적으로 진행해 왔고, 양질의 데이터도 꾸준히 축적해 왔다.

 

AI 학습은 딥러닝 분야 전문가로 구성된 삼성리서치 연구원들이 중요한 역할을 했다. 유 프로는 “연구 개발 과정에서 AI 번역 결과의 품질이 좋지 않으면, 문제를 파악하고 개선해야 한다. 연구원의 역량과 경험이 부족하면 문제의 원인을 찾는 데 오랜 시간이 걸리고, 해결 방안을 찾지 못할 수도 있다. 우리 연구원들은 전문성과 노하우를 활용하여 문제의 원인을 분석하고, 개선하는 과정을 빠르게 수행할 수 있다”라고 자부심을 내비쳤다.

 

AI 번역 모델의 번역 성능은 어떻게 검증할까. 삼성리서치 연구팀은 AI 번역 모델의 성능 검증을 위해서 테스트 세트 기반의 정량 평가와 번역사를 통한 정성 평가를, MX사업부 개발실에서는 다양한 테스트 세트를 구성하여 정성 평가를 진행하고 있다.

 

또한 세계적 권위의 기계번역 대회에 출전하며 외부 검증도 받고 있다. 유 프로는 “대회 출전에는 많은 시간과 준비가 필요하지만, 대회에서 우수한 성적을 거두는 것도 연구 개발의 원동력이 될 수 있다 ”며 “팀원 모두가 자유로운 분위기로 토론하고 다양한 아이디어를 시도하면서 좋은 성적을 거둘 수 있었다”고 말했다.

 

존댓말, 성조, 문장 기호 등… “언어마다 다른 특징도 세심하게 이해했죠”

언어마다 존댓말, 성조, 문장 기호 등 그 문화에만 통용되는 다양한 특징들이 있다. AI 실시간 통번역 기능은 언어적 특징을 최대한 고려해 번역의 완성도를 높였다. 예를 들어, 한국어와 일본어처럼 존댓말이 있는 언어는 통역 시 존댓말로 번역하도록 학습시킨 것이다.

 

해당 언어와 문화를 잘 이해하고 있는 해외 현지 연구소와의 협업도 동시에 진행했다. 최윤정 프로는 “해외 연구소의 연구원, 언어전문가와 긴밀하게 협력하면서, 번역의 완성도를 높일 수 있었다”고 말했다.

 

각국의 다양한 언어를 다루기 때문에 종종 시행착오도 따랐다. 최 프로는 “베트남어는 성조가 있는데, 사용자들이 채팅에서 일상 대화를 할 땐 성조를 생략하는 경우가 많다는 것을 알게 되어 성조가 없는 문장도 번역되게끔 데이터를 추가 구축했다”고 일화를 소개했다. 또한 문장 부호가 없는 태국어를 위한 별도의 문장 분리기를 개발하는 등 삼성리서치 연구팀은 AI 번역 모델의 성능을 향상하고자 세심한 노력을 기울였다.

 

온디바이스 AI 적용 비결? “가볍게 만드는 ‘경량화’ 기술 덕분이죠”

Teacher모델 지식 전이 증류 지식 전이 Student 모델 데이터

 

삼성리서치는 2019년부터 ‘온디바이스 AI 모델’ 개발을 시작했다. 유용현 프로는 “온디바이스 AI 모델은 서버 기반 AI 모델과 다르게 사용자의 기기만 이용하여 구동되기 때문에 적은 양의 연산 및 메모리 자원으로도 실행할 수 있도록 모델의 사이즈를 줄이는 경량화 기술이 가장 중요하다”고 강조했다. AI 모델 경량화를 위해서 ‘지식 증류(Knowledge Distillation) 방식’과 ‘양자화(Quantization)’ 기술을 활용했다.

 

지식 증류는 성능이 좋지만 모델 사이즈가 큰 Teacher 모델로부터 핵심 지식을 뽑아내어 작은 Student 모델로 전달하는 방식이다. 선생님이 일목요연하게 정리한 내용으로 학생이 공부하면 쉽게 이해할 수 있을 뿐만 아니라 효율적으로 공부할 수 있는 것과 비슷하다.

 

실제 딸기 사진(매우 많은 색상 정보) 양자화 녹색과 빨간색으로 그린 딸기(최소한의 색상 정보)

 

양자화 기술은 AI 알고리즘을 단순화하여 모델 크기를 줄이고 연산 과정을 효율화하여 응답 속도를 높이는 기술이다. 유 프로는 양자화 기술을 ‘딸기 그리기’에 비유했다. “딸기를 실제와 동일하게 그리기 위해서는 사실상 무수히 많은 색상 정보가 필요하지만 빨간색, 녹색처럼 간단한 색상으로도 표현할 수 있다”며 “양자화는 딸기를 그릴 때 필요한 색의 수를 최소화하면서 실제와 가깝게 그리도록 노력하는 과정”이라고 쉽게 설명했다.

 

지식 증류 방식과 양자화 개념은 AI 모델 경량화에서 잘 알려진 방식이지만, 연구원마다 세부적인 실험 방식이나 요소들이 모두 다르기 때문에 상용화 수준으로 구현하는 것은 결코 쉽지 않다. 삼성리서치 연구팀은 효율적인 양자화 방식을 찾고 속도 개선 알고리즘을 개발하며 이를 독자적인 기술로 발전시켰다. 최 프로는 “우리도 다양한 실험과 연구를 통해서 가장 적절한 경량화 방법을 찾아냈다”고 말했다.

 

고품질 AI 번역 모델을 압축한 경량화 모델에 응답 속도를 빠르게 만드는 알고리즘까지 적용해 가볍고 빠른 온디바이스 AI 번역 기능이 마침내 탄생한 것이다.

 

“언어를 넘어 문화를 이해하는 완벽한 번역기를 만드는 것이 목표”

온디바이스 AI 분야를 선도하고 있는 삼성리서치 글로벌 AI센터 연구원들의 목표는 무엇일까. 최윤정 프로는 “외국인과 소통할 때 어떠한 거슬림도 없이 매끄럽고 편리하게 대화하도록 돕는 것이 최종 목표”라고 말했다. 유 프로는 완벽한 번역기를 향한 꿈과 열정을 밝혔다. 그는 “언어를 넘어 문화를 이해하고 지식을 갖춘 완벽한 번역기가 언젠가 개발될 것”이라며 “세상에 아직 등장하지 않은 고도화된 번역기를 만드는 데 도전하고 싶다”는 당찬 포부를 드러냈다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다.
📝게시판 소유자(1)✨️🥇미게 지박령🥉미코의 심심이🥇미코의 잡담왕🥇소식게 수호자🥈유게 공무원🥉큰게 좋아🥉할인 경보
댓글
5
polorbear
1등 polorbear
2024.04.27. 01:34

구글껄 자들이 한것처럼 포정하는건...쫌... 

양심이 없는건가..

[polorbear]님의 댓글을 신고합니다. 취소 신고
BarryWhite
글쓴이
best BarryWhite polorbear 님께
2024.04.27. 01:43

근데 자료 읽어보면 번역은 구글게 아니라 그냥 삼성 리서치에서 연구개발한 것 같읍니다.

2013년부터 사내에서 번역 서비스를 썼다고 하니.

[BarryWhite]님의 댓글을 신고합니다. 취소 신고
Vㅔ리굿
best Vㅔ리굿 polorbear 님께
2024.04.27. 02:10

언어쪽은 삼성 자체일거에요

[Vㅔ리굿]님의 댓글을 신고합니다. 취소 신고
마일로스
마일로스 polorbear 님께
2024.04.27. 09:59

자체 개발이고, 덕분에 on device로 제공하고 있죠

[마일로스]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 19.11.15 9 49553
핫글 소식 일론 머스크, 스스로 트위터 규정 어기고 선거 관련 AI 영상 공유해 [2] newfile Stellist 09:12 2 351
핫글 소식 구영배 큐텐 대표 “큐텐 지분 전체 걸고 피해 회복 최우선” 첫 입장 [1] new 뉴스봇 09:45 1 314
2854 소식 HED, 최초의 Wifi 헤드폰 Unity 발표 [5] file Stellist 23.04.15 3 736
2853 소식 2023년 2분기 스마트폰 시장, 축소됐지만 회복 조짐 보여 [1] file Stellist 23.07.19 3 296
2852 소식 MS 윈도11 리콜 기능, 심각한 보안 결함 논란 [3] BarryWhite 24.06.08 3 939
2851 소식 KAIST, 인간의 뇌 모방 뉴로모픽 반도체 개발 뉴스봇 21.08.05 3 276
2850 소식 Threads, 유저가 10억명은 되어야 광고삽입 고려할 것 [3] file Stellist 23.07.07 3 692
2849 소식 루머 : 애플, 서드파티앱 기능 가져온 일기장 앱 준비중 [6] file Stellist 23.04.21 3 1340
2848 소식 하이 빅스비 잠금해제 해줘…갤럭시S21 원UI 3.1 음성 잠금해제 기능 지원? [7] 뉴스봇 20.11.26 3 789
2847 애플 : 아이패드미니6 젤리스크롤 정상, 아무 조치도 취하지 않을 것 [4] file Stellist 21.09.29 3 851
2846 소식 엑시노스 2500 새로운 냉각 솔루션 적용 가능성 [3] BarryWhite 24.07.06 3 1350
2845 반다이, 시계형 다마고치 Tamagochi Smart 발표 [3] file Stellist 21.06.18 3 739
2844 소식 내년 아이폰 16 프로, 개선된 망원 렌즈 탑재 가능성 [6] BarryWhite 23.10.31 3 916
2843 소식 ASUS, 새 스마트폰 Zenfone 11 Ultra 발표 [2] file Stellist 24.03.15 3 3502
2842 소식 3년→5년 안드로이드 OS 지원 기간 늘어난다 [4] 뉴스봇 21.07.19 3 945
2841 소식 구글 픽셀 7a 네 번째 색상 '코랄' 렌더링 공개 [1] BarryWhite 23.04.28 3 655
2840 네이버, 급상승 검색어 25일 폐지 뉴스봇 21.02.04 3 350
2839 소식 애플, 오는 28일 '애플 뮤직 클래식' 출시…한·중·일·대만은 제외 프로입털러 23.03.10 3 542
2838 (업데이트 : 스킨임) 루머 : XBOX 시리즈X 화이트 색상 유출? file Stellist 22.09.23 3 653
2837 소식 AMD 핸드헬드 칩셋, 리눅스 벤치서 애플 M2 맥북 에어 제쳐 [1] BarryWhite 23.07.23 3 428
2836 '잠시 꺼두셔도 좋다'던 011, 완전히 꺼졌다…SKT 2G번호 일괄해지 [1] 프로입털러 22.08.01 3 935
2835 소식 [단독] 경계현 삼성전자 사장, 美 출장 나서… ‘파운드리’ 핵심 고객사 만나 [1] 갤럭시Z플립4 22.04.18 3 1449
2834 인텔 CEO, 9일 방한…이재용 회장과 협력방안 논의할 듯 [1] 프로입털러 22.12.04 3 466
2833 구글, 안드로이드용 64비트 크롬 출시 [13] 뉴스봇 21.03.14 3 1017
2832 LG, 안드로이드 업데이트 대상 기종 공개 [2] file Stellist 21.04.08 3 432
2831 소식 미국 UDC "청색 인광 OLED 소재, 2024년 상용화" [1] 뉴스봇 22.02.28 3 554
2830 소식 아이픽스잇, 현미경으로 아이폰 15 부품 조사 BarryWhite 23.10.07 3 758
2829 트위터, 글로벌 TOP10 해시태그 공개…‘BTS’, ‘미얀마’에 높은 관심 [2] file 뉴스봇 21.08.23 3 531
2828 소식 中 보란듯 꺼낸 삼성의 신기술..."우린 두 번 접는다" [1] 뉴스봇 21.12.28 3 816
2827 소식 루머 : 삼성 갤럭시A55 유출CAD 기반 렌더링, 비대칭 디자인 보여줘 [1] file Stellist 23.12.03 3 806
2826 소식 본인 줄기세포 이용, 파킨슨병 치료 성공 [2] file BarryWhite 20.06.02 3 365
2825 5G 속도 빨라진다…이통사, LTE망과 분리기술 개발 [2] 신규유저 21.01.04 3 327

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...