로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

뉴스봇

소식 AI 챗봇 ‘심심이’, 연구 위해 대화 데이터 공개 본격화

인공지능(AI) 챗봇 '심심이'가 인공지능/빅데이터 연구자를 위한 데이터 공개를 본격화한다. 심심이에 따르면 20년 동안 축적해 온 초거대 대화 데이터를 7월부터 인공지능/빅데이터 연구·개발 커뮤니티에 공개한다고 밝혔다.

심심이는 대화 데이터 특성을 감안해 웹서비스 깃허브(GitHub) 등에 전면 공개하는 방식을 활용하지 않기로 했다. 연구자 또는 연구팀 개별 신청을 접수 받은 뒤 심사, 비밀 유지 서약 등 관련 절차를 마친 다음 요구사항에 따라 제공 및 관리하는 방식을 활용하기로 결정한 것이다. 심심이 대화 데이터를 제공받고자 하는 연구자라면 심심이 한국어 공식 블로그에서 신청서를 내려받아 작성한 다음 제출·승인 후 소정의 절차를 거쳐 이용할 수 있다.

AI 챗봇 심심이는 지난 2002년 서비스를 처음 시작한 이래 10년 동안 한국어 대화 중심으로 운영돼 왔다. 이어 지난 2012년부터 글로벌 서비스를 시작해 81개 언어를 바탕으로 전 세계 4억 명 이상의 누적 사용자를 확보했다.

심심이(주)측은 다양한 언어를 사용하는 세계 각국에서 고르게 인기를 누릴 수 있었던 요인으로 사용자가 직접 학습시킬 수 있는 인공지능 챗봇 심심이의 특성 덕분이라고 말했다. 유저가 방금 가르친 대화를 심심이가 바로 습득한다는 점에서 신선한 흥미를 유발한 것이다. 이러한 매력이 입소문을 타면서 글로벌 AI 챗봇으로 거듭날 수 있었다는 평가다.

실제로 심심이는 특유의 커뮤니케이션 구조 덕분에 생동감 넘치는 대화를 전개하며 갈수록 더욱 많은 데이터를 확보하고 있다. 이번에 심심이가 공개하기로 한 대화 데이터의 총 수량은 약 150억 건이다. 이 가운데 한국어 대화 데이터는 약 3억 건에 이른다. 대화 데이터 유형은 사용자가 심심이에게 가르친 대화 시나리오(싱글턴), 사용자-심심이 대화 데이터(준 멀티턴), V2 서비스의 심심이-심심이 대화 데이터(멀티턴) 등으로 나뉜다.

특히 심심이는 이미 10여 년 전부터 대화 기술을 이용하고자 하는 전 세계 개발자들을 위해 API(Application Programming Interface) 제공 서비스를 오픈한 바 있다. 그 결과 3만 여 개 이상의 크고 작은 써드파티 기업 및 개인에게 제공하는 등 여러 노력을 하였다.

최근에는 개발자 사이트인 심심이 챗봇공방에서 공공성 기반 연구개발 프로젝트에 무료 제공 혹은 할인 혜택을 진행하고 있다. 이에 따라 초·중등 교육 프로그램, 박물관 도슨트, 장애인 보조를 위한 챗봇 연구 개발 등 여러 프로젝트에서 호응을 얻고 있다. 그러나 심심이 측은 API 수준의 데이터 제공만으로는 연구 시각을 다양화하는데 부족한 면이 많다고 판단했다. 따라서 원천데이터 수준의 공개를 결정했다는 설명이다.

심심이(주) 최정회 대표는 "대화형 인공지능(AI)이 최근 대세로 자리잡으면서 심심이 대화 데이터 수요가 점점 두터워지고 있는데, 특히 심심이는 국내외 학교, 연구소, 기업들과 데이터 제공관련 협력프로세스를 쌓으며 의미 있는 성과를 도출해왔다. 또한 최근에는 과학기술정보통신부(이하 과기정통부)가 주관하고 한국지능정보사회진흥원(이하 NIA)이 추진하는 2022년도 인공지능 학습 데이터 구축사업에서 한국어 블렌더봇 데이터 과제를 수행하며 공공 대화 데이터 구축에도 힘을 쏟고있다"며 "이 과정에서 한국어 챗봇 연구개발을 위한 대화 데이터가 빈약한 점이 안타까웠는데 적어도 연구자들에게는 보다 폭넓게 대화 데이터를 제공할 수 있다는 점에 착안했다."고 강조했다.

뉴스봇
·🏆정보의 신⚡
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 19.11.15 9 49574
핫글 소식 인텔, CPU 산화 문제 2년 전 인지...해결 여부는 불투명? [1] new BarryWhite 01:12 2 353
핫글 소식 라리안, 발더스 게이트4 프로토타입 제작했으나 개발 취소 new BarryWhite 01:03 1 149
핫글 소식 EcoFlow, 태양광충전 모자 Power Hat 발표 [1] newfile Stellist 08:06 1 136
46923 소식 어메이즈핏, 초슬림·초경량 스마트워치 ‘GTS 4 미니’ 출시 뉴스봇 22.08.08 0 277
46922 소식 [알림] '마이크로 디스플레이 핵심기술과 메타버스의 만남' 콘퍼런스 뉴스봇 22.08.08 0 119
46921 카카오, ‘카카오톡 안녕캠페인’으로 안전 중요성 알린다 [3] 프로입털러 22.08.08 0 326
46920 삼성전자, ‘뉴 갤럭시 NFT 생태계 구축’ MOU체결 프로입털러 22.08.08 0 183
46919 소식 마이크론, 데이터센터용 176-레이어 NAND SATA SSD 출시 file 뉴스봇 22.08.08 0 102
46918 프리미엄 무선 이어폰 ‘LG 톤 프리’ 신제품 출시 프로입털러 22.08.08 0 171
46917 구글 픽셀폰, 국내 출시 임박?…"픽셀 카메라 엔지니어 뽑는다" 프로입털러 22.08.08 0 292
46916 "우산 챙겨"라고 하니…카카오톡에서 우산 쓴 죠르디가 나왔다 프로입털러 22.08.08 1 662
46915 LGU+, 장기 가입자 우대…"명절 선물에 데이터 쿠폰" 프로입털러 22.08.08 1 261
46914 소식 나오자 마자 ‘대기 1년’..기아, 스포티지 LPG 서둘러 증산 뉴스봇 22.08.08 0 135
46913 소식 주연테크, 12세대 인텔 코어 프로세서 노트북 리오나인 L9W36 출시 file 뉴스봇 22.08.08 0 158
46912 소식 인스타그램, NFT 기능 한국 포함 전 세계로 확대 도입 뉴스봇 22.08.08 0 84
46911 LG, ANC 무선이어폰 톤프리 T90/톤프리핏 TF8 발표 [1] file Stellist 22.08.08 4 674
46910 三電 양산 속도 3나노, 추격 발판되나…TSMC는 '인텔 변수'에 발목 [3] 프로입털러 22.08.08 1 818
46909 방통위 "'재고정리 2만원' 등 휴대전화 판매사기 주의" [1] 프로입털러 22.08.07 0 486
46908 정부, 美에 '칩4 예비회동' 제안 [4] 프로입털러 22.08.07 1 598
46907 삼성전자 갤럭시 보안 허점, 이스라엘 연구자들이 막았다 프로입털러 22.08.07 0 462
46906 ‘황새’ 韓 따라 잡으려다 가랑이 찢어진 ‘뱁새’ 日 JOLED…낮은 수율로 시장 신뢰 치명타 JamesBlake 22.08.07 3 881
46905 iPhone 14, 중국-대만 긴장 고조로 지연될 수 있음 뉴스봇 22.08.07 0 291
46904 소식 “네이버와 쿠팡만 성장할 것” 네이버의 커머스 사업 분석 뉴스봇 22.08.07 3 971
46903 삼성전자, 갤럭시 S22 시리즈 사용자 대상 ‘One UI 5’ 베타 프로그램 실시 프로입털러 22.08.07 0 758
46902 소식 구글, Foxconn에 Pixel7과 Pixel Foldable 제품 주문 뉴스봇 22.08.06 0 329
46901 소식 아마존 리스트에 삼성 갤럭시 Z 폴드 4를 사양과 렌더링 등장 [1] 뉴스봇 22.08.06 4 782
46900 애플, 공급업체에 “대만산 부품 ‘메이드 인 타이완’ 표기 안 돼” [3] 프로입털러 22.08.06 13 1157
46899 소식 애플 아이폰14 OLED 재료셋 이야기 뉴스봇 22.08.05 0 593
46898 소식 HBO Max와 Discovery+가 내년에 하나의 서비스로 통합됨 뉴스봇 22.08.05 0 439
46897 중국도 '낸드 200단' 뛰어넘었다…K 반도체 턱밑까지 추격 프로입털러 22.08.05 1 516
46896 다누리 임무는 우주인터넷 실험·착륙 후보지 탐색 프로입털러 22.08.05 0 196
46895 사상 최대 매출에도 못 웃는 네이버…수익성 개선 속도낸다(종합) 프로입털러 22.08.05 0 463
46894 '다누리' 궤도 올랐다…韓 우주의 꿈, 달 향한다(종합) 프로입털러 22.08.05 2 247

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...