미니 구글 새로운 신경망 기반의 음성인식 기술 발표
- 다잊어야해욥
- 조회 수 221
- 2019.03.13. 13:42
구글은
Gboard의 음성 입력에 인공지능과 새로운 신경망 구조 (아래의 표처럼 그간의 음성인식 기능을 뛰어넘는 다양한 논리구조를 포함)
엔드 - 투 - 엔드 방식의 스마트폰에 내장되는 음성 인식 기술을 발표(450mb)했습니다.
해당 음성 인식 스트리밍은 RNN 변환기 (RNN-T) 기술을 사용하여 휴대 전화에 다운로드 해 설치 할 수있는 소형화를 구현했습니다.
즉, 더 이상 네트워크 대기 시간이나 서버를 통한 딜레이가 없습니다.
왼쪽 서버 + 단순 딥러닝 기반 >> 논리구조 한계로 딜레이 발생
오른쪽 새로운 신경망 구조+ 스마트폰 내장방식
딜레이 없이 타자보다 빠른 속도
오프라인 상태에서도 새 인식기를 항상 사용할 수 있습니다.
이 모델은 캐릭터 레벨에서 작동하므로 말하면서 누군가가 당신이 말한 것을 실시간으로 타이핑하는 것처럼 그리고 키보드 받아쓰기 시스템에서 실제 입력하는 것보다 빠르고 똑같이 단어를 문자 단위로 출력합니다 .
해당 기능은 픽셀에 우선 적용되고 영어로 시작됩니다. 다만 다른언어들도 조만간 추가 됩니다.
댓글
알파벳 주식을 사야겠네요.