소식 ETRI, 엑소브레인 구어체 언어분석 API 공개
- BarryWhite
- 조회 수 229
- 2020.08.07. 00:44
-전이학습·데이터 증강기법 활용, 학습데이터 부족 극복
-기존 모델대비 41% 오류 개선, 한국어 최고수준 달성
-문어체 API 총 2천6백만 건 활용, 고성능 버전 추가 공개
한국전자통신연구원(ETRI), 30일 구어체 언어분석 인공지능 기술 엑소브레인(Exobrain) API를 사이트에 공개.
-한컴오피스 2020에 탑재 돼, 이미 상용화가 이뤄진 인공지능
-언어분석 기술, 딥러닝 언어모델 기술, 질의응답 기술 등 적용
-기존 문어체 기술 고도화, 사람의 대화까지 정확하게 이해할 수 있는 구어체 언어분석 기술 개발 성공
-형태소분석과 개체명 인식 기술로 구어체 언어분석
-TTA 표준 가이드라인을 따르며, 형태소 태그는 47개, 개체명 태그는 146개
-사람의 대화 분석 오류를 최대 41% 개선해 정확하게 이해
-형태소분석은 메캡(Mecab) 오픈소스 라이브러리 대비 10.6% 더 우수
-예컨대 “경상도인데”를 “경상돈데”라고 구어체로 표현하는 경우, 기존 형태소분석 기술은 ‘경상도+인데’라는 축약 표현을 인식하지 못한 채 ‘경상돈+데’라고 분석하지만, 엑소브레인은 이를 이해
-ETRI 구어체 언어분석 API와 성능을 개선한 문어체 언어분석 API도 추가 공개
🥇소식게 수호자🥇미게 지박령🥉큰게 좋아🥇미코의 잡담왕🥈유게 공무원🥉할인 경보📝게시판 소유자(1)✨️🥉에로게 심심이
댓글
이런 게 로컬라이제이션쪽에 도입되면 참 좋겠다는 생각이 듭니다...
이(가), 은(는), (으)로, 와(과)... 같이 눈에 거슬리는 조사들 쓰기 싫어도 어쩔 수 없이 넣어야 되거든요.