음성파일 텍스트로 바꾸는 MS 워드의 신기능··· 세상 좋아졌다
- 블랙리스트
- 조회 수 521
- 2021.03.22. 01:18
[디지털데일리 이종현기자] 인공지능(AI) 기반 기술이 우후죽순 쏟아져 나오는 가운데 마이크로소프트(MS)가 새로운 기술을 선보였다. 음성파일에서 텍스트를 자동을 추출하는 녹음 전사 기능인 ‘기록(Transcribe)’이다.
MS의 워드프로세서 프로그램 ‘워드’의 웹용 버전에서 이용할 수 있는 이 기능은 지난해 첫 선을 보였다. 당초 영어로만 제공되는 기능이었으나 최근 한국어도 지원하도록 업데이트됐다.
기능은 간단하다. 웹용 워드의 기록 기능을 통해 동영상 파일이나 오디오 파일을 업로드하면 파일 내 텍스트를 자동으로 추출한다. 말하는 이에 따라 스피커 1, 2 등으로 화자 인식을 한다. 어느 시간에 누가 말을 했는지도 구분한다. 지원하는 확장자는 .wav, .mp4, .m4a, .mp3 등 4개다.
MS 코리아의 유튜브 채널에 올라온 1분 남짓의 영상으로 테스트를 진행했다. 테스트 결과 ‘보안’을 ‘교환’으로, ‘한가지 자신 있게’를 ‘항상 자신 있게’ 등 오인식하는 경우가 왕왕 있었다. 화자를 인식하지 못해 한 사람의 말을 2명의 화자로 구분하기도 했다.
결과물에 대한 평가는 개개인에 따라 다를 듯하다. 문서 작업이 주된 업무인 기자의 입장에서는 보조적인 수단으로 활용하기에는 부족함이 없다고 느껴졌다. 녹음된 음성을 듣더라도 발음, 주변 소음 등으로 단어를 놓치는 일이 많기에 일부 오인식이 있는 것은 큰 흠이 아니다. 정확한 발음이 아니면 인식하지 못하던 과거를 떠올리면 그야말로 장족의 발전이다.
음성을 텍스트화하는 것은 완전히 새로운 기술은 아니다. MS 워드는 기록 기능 이전에 키보드 대신 음성을 인식해 텍스트화하는 ‘받아쓰기’ 기능을 제공했다. 구글 문서에서도 ‘음성 입력’ 기능을 제공한다.
(하략)
-----------------------------------------------------------------------------
작년 8월 웹용 워드에 전사 기능에 해당하는 기록(Transcribe)이 추가되었는데 영어(미국)만 우선적으로 지원했었고, 추후 지원 언어를 넑혀나간다고 했었는데 생각보다 매우 빠른 시일 내에 한국어 지원이 최근에 이루어 졌습니다 한국어 포함 80개 정도의 언어를 지원합니다!
마이크로소프트365(구 명칭. 오피스365) 구독자에서 한해서만 제공되고 대학교에서 대학생들한테 무료로 제공하는 오피스365 에듀케이션도 사용이 가능합니다.
그리고 이미 작년부터 받아쓰기가 미리 보기 언어로 한국어 지원이 추가가 되서 PC에 마이크만 있으면 음성 받아쓰기를 이용하여 한국어로 문서 작성이 가능합니다!
아직 받아쓰기나 기록이나 한국어 인식률이 엄청 뛰어나거나 그런건 아니면 대학생분들 경우 노트북이 있다면 강의실에서 교수님의 강의내용을 받아적거나 할때 유용하지 않을까 싶습니다.
기록(Transcribe)은 녹음된 오디오 파일을 등록해서 하는 것도 가능하기에 강의시간에 노트북이 없더라도 스마트폰을 통해 녹음된 음성 파일을 가지고도 나중에 PC에서 웹용 워드에서 등록해서 사용할 수 있으니까 요긴할듯 합니다.
네이버에 있던 비슷한 앱으로 과거 통화녹음 돌려보니 필요한 정보 찾기가 참 편했던 기억이 있네요.
그건 부분 유료여서 사용량에 제한이 있었는데, 이건 오피스 사용자에게는 무료라 좋아보이네요.