로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

뉴스봇

소식 AI 챗봇 ‘심심이’, 연구 위해 대화 데이터 공개 본격화

인공지능(AI) 챗봇 '심심이'가 인공지능/빅데이터 연구자를 위한 데이터 공개를 본격화한다. 심심이에 따르면 20년 동안 축적해 온 초거대 대화 데이터를 7월부터 인공지능/빅데이터 연구·개발 커뮤니티에 공개한다고 밝혔다.

심심이는 대화 데이터 특성을 감안해 웹서비스 깃허브(GitHub) 등에 전면 공개하는 방식을 활용하지 않기로 했다. 연구자 또는 연구팀 개별 신청을 접수 받은 뒤 심사, 비밀 유지 서약 등 관련 절차를 마친 다음 요구사항에 따라 제공 및 관리하는 방식을 활용하기로 결정한 것이다. 심심이 대화 데이터를 제공받고자 하는 연구자라면 심심이 한국어 공식 블로그에서 신청서를 내려받아 작성한 다음 제출·승인 후 소정의 절차를 거쳐 이용할 수 있다.

AI 챗봇 심심이는 지난 2002년 서비스를 처음 시작한 이래 10년 동안 한국어 대화 중심으로 운영돼 왔다. 이어 지난 2012년부터 글로벌 서비스를 시작해 81개 언어를 바탕으로 전 세계 4억 명 이상의 누적 사용자를 확보했다.

심심이(주)측은 다양한 언어를 사용하는 세계 각국에서 고르게 인기를 누릴 수 있었던 요인으로 사용자가 직접 학습시킬 수 있는 인공지능 챗봇 심심이의 특성 덕분이라고 말했다. 유저가 방금 가르친 대화를 심심이가 바로 습득한다는 점에서 신선한 흥미를 유발한 것이다. 이러한 매력이 입소문을 타면서 글로벌 AI 챗봇으로 거듭날 수 있었다는 평가다.

실제로 심심이는 특유의 커뮤니케이션 구조 덕분에 생동감 넘치는 대화를 전개하며 갈수록 더욱 많은 데이터를 확보하고 있다. 이번에 심심이가 공개하기로 한 대화 데이터의 총 수량은 약 150억 건이다. 이 가운데 한국어 대화 데이터는 약 3억 건에 이른다. 대화 데이터 유형은 사용자가 심심이에게 가르친 대화 시나리오(싱글턴), 사용자-심심이 대화 데이터(준 멀티턴), V2 서비스의 심심이-심심이 대화 데이터(멀티턴) 등으로 나뉜다.

특히 심심이는 이미 10여 년 전부터 대화 기술을 이용하고자 하는 전 세계 개발자들을 위해 API(Application Programming Interface) 제공 서비스를 오픈한 바 있다. 그 결과 3만 여 개 이상의 크고 작은 써드파티 기업 및 개인에게 제공하는 등 여러 노력을 하였다.

최근에는 개발자 사이트인 심심이 챗봇공방에서 공공성 기반 연구개발 프로젝트에 무료 제공 혹은 할인 혜택을 진행하고 있다. 이에 따라 초·중등 교육 프로그램, 박물관 도슨트, 장애인 보조를 위한 챗봇 연구 개발 등 여러 프로젝트에서 호응을 얻고 있다. 그러나 심심이 측은 API 수준의 데이터 제공만으로는 연구 시각을 다양화하는데 부족한 면이 많다고 판단했다. 따라서 원천데이터 수준의 공개를 결정했다는 설명이다.

심심이(주) 최정회 대표는 "대화형 인공지능(AI)이 최근 대세로 자리잡으면서 심심이 대화 데이터 수요가 점점 두터워지고 있는데, 특히 심심이는 국내외 학교, 연구소, 기업들과 데이터 제공관련 협력프로세스를 쌓으며 의미 있는 성과를 도출해왔다. 또한 최근에는 과학기술정보통신부(이하 과기정통부)가 주관하고 한국지능정보사회진흥원(이하 NIA)이 추진하는 2022년도 인공지능 학습 데이터 구축사업에서 한국어 블렌더봇 데이터 과제를 수행하며 공공 대화 데이터 구축에도 힘을 쏟고있다"며 "이 과정에서 한국어 챗봇 연구개발을 위한 대화 데이터가 빈약한 점이 안타까웠는데 적어도 연구자들에게는 보다 폭넓게 대화 데이터를 제공할 수 있다는 점에 착안했다."고 강조했다.

뉴스봇
·🏆정보의 신⚡
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 19.11.15 9 49542
핫글 소식 알리, 개인정보법 어겨 韓서 과징금 20억 철퇴 BarryWhite 24.07.25 3 190
핫글 소식 핏빗 데이터가 밝혀낸 수면의 비밀: 수면 시간과 질, 건강에 미치는 영향 new BarryWhite 24.07.25 2 251
핫글 소식 삼성, 갤럭시 링 수요 많아 생산량 100만대로 늘려 [3] updatefile Stellist 24.07.25 2 448
31477 소식 소니 PS5 국내 출시일 및 가격 공개, 9월 18일 12시부터 예약판매 시작 뉴스봇 20.09.17 0 124
31476 소식 ES 파일 탐색기, 보안 취약점 발견...스마트폰 속 개인정보 유출 위험 신규유저 19.02.19 0 124
31475 소식 차세대 애플 아이폰SE4, 가격 인상될까 BarryWhite 24.05.21 0 124
31474 소식 5배 빠른 '5G 와이파이' 나온다... 과기정통부, 6GHz 비면허 주파수 공급 신규유저 20.10.15 0 124
31473 소식 美 개발자, 테슬라 카드키서 RFID칩 분리해 팔에 이식 뉴스봇 19.08.11 0 124
31472 소식 AMD, 젠 3 기반 라이젠 PRO 5000 시리즈 모바일 CPU 발표 뉴스봇 21.03.18 0 124
31471 소식 예대적자 해소한 토스뱅크, 올해 흑자전환 가능성 있나 뉴스봇 22.06.29 0 124
31470 소식 대만 검사·계측장비 업체 크로마, 이스라엘 캠텍 지분 20% 인수 합의 뉴스봇 19.02.12 0 124
31469 소식 글로벌 칼럼 | “단순한 매몰비용 아니다” 레거시 시스템의 진정한 가치 뉴스봇 23.07.18 0 124
31468 소식 노트북과 태블릿의 만남···10.1형 투인원 ‘레노버 아이디어패드 D330’ 출시 [1] 뉴스봇 18.09.04 0 124
31467 소식 애플 휘청하자 관련 부품주 `와르르` 뉴스봇 18.11.13 0 124
31466 소식 네이버, 분기 매출 사상 첫 '2조' 돌파...라인 빼면 1조3608억 file 신규유저 20.10.29 0 124
31465 소식 샤오미, 배터리 업체에 투자 뉴스봇 21.01.21 0 124
31464 소식 인텔, 장애인 대상 음성합성 AI 기술 지원 [2] 뉴스봇 20.08.26 0 124
31463 소식 AMD 라데온 RX 6000 시리즈, 약 2달 만에 드라이버 업데이트 계획 뉴스봇 23.02.06 0 124
31462 소식 위드 코로나 시대, 노트북 지금 사도 좋을까? 뉴스봇 21.11.24 0 124
31461 소식 Xbox 올 액세스 사전예약 11월 3일부터, 올해는 SK텔레콤 고객만 신청 가능 뉴스봇 20.10.29 0 124
31460 아쉬울 것 없어라··· 크롬북 고급 사용자를 위한 리눅스 앱 9종 말없는벌새 20.11.25 0 124
31459 소식 AMD 라데온 RX 7000 시리즈, 최대 메모리 버스 384bit? file 뉴스봇 22.07.14 0 124
31458 소식 ‘오미크론’ 앞에 작아진 CES… 국내기업은 역대 최다 참가 뉴스봇 22.01.07 0 124
31457 소식 Fitbit, Sense 2, Versa 4, Inspire 3 웨어러블 출시 뉴스봇 22.08.25 0 124
31456 소식 에릭슨·노키아 탈중국, 국내 통신 장비 업계 연쇄이동 움직임 Aimer 20.10.14 1 124
31455 소식 김택진-개발, 박병무-신사업발굴...엔씨 공동대표 체제로 글로벌 경쟁력 강화 BarryWhite 24.03.20 0 124
31454 소식 “올해 CEO 최우선 과제는 성장…응답률 62%, 2014년 이후 최고” 뉴스봇 24.05.27 0 124
31453 소식 LG전자, CES2020에서 LG 씽큐 존 공개 뉴스봇 19.12.22 0 124
31452 소식 미 뉴욕주, 청소년에게 콘텐츠 추천 알고리즘 적용 금지법 통과 뉴스봇 24.06.10 0 124
31451 소식 차세대 Xbox, 3개월 또는 4개월마다 퍼스트 파티 게임 출시 예정 [1] 뉴스봇 19.12.02 0 124
31450 소식 PI첨단소재, LG디스플레이와 PI 바니시 평가 돌입 뉴스봇 21.12.15 0 124
31449 소식 AMD-이카엑스, 차세대 전기자동차 내 컴퓨팅 플랫폼 개발 협력 뉴스봇 22.08.08 0 125
31448 소식 신즈광그룹 체제 확립, 중국 반도체 부흥 이끌까 뉴스봇 23.08.14 0 125

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...