로그인 해주세요.

IT 소식 *최신 IT소식을 보거나 등록하실 수 있습니다.

뉴스봇

소식 AI 챗봇 ‘심심이’, 연구 위해 대화 데이터 공개 본격화

인공지능(AI) 챗봇 '심심이'가 인공지능/빅데이터 연구자를 위한 데이터 공개를 본격화한다. 심심이에 따르면 20년 동안 축적해 온 초거대 대화 데이터를 7월부터 인공지능/빅데이터 연구·개발 커뮤니티에 공개한다고 밝혔다.

심심이는 대화 데이터 특성을 감안해 웹서비스 깃허브(GitHub) 등에 전면 공개하는 방식을 활용하지 않기로 했다. 연구자 또는 연구팀 개별 신청을 접수 받은 뒤 심사, 비밀 유지 서약 등 관련 절차를 마친 다음 요구사항에 따라 제공 및 관리하는 방식을 활용하기로 결정한 것이다. 심심이 대화 데이터를 제공받고자 하는 연구자라면 심심이 한국어 공식 블로그에서 신청서를 내려받아 작성한 다음 제출·승인 후 소정의 절차를 거쳐 이용할 수 있다.

AI 챗봇 심심이는 지난 2002년 서비스를 처음 시작한 이래 10년 동안 한국어 대화 중심으로 운영돼 왔다. 이어 지난 2012년부터 글로벌 서비스를 시작해 81개 언어를 바탕으로 전 세계 4억 명 이상의 누적 사용자를 확보했다.

심심이(주)측은 다양한 언어를 사용하는 세계 각국에서 고르게 인기를 누릴 수 있었던 요인으로 사용자가 직접 학습시킬 수 있는 인공지능 챗봇 심심이의 특성 덕분이라고 말했다. 유저가 방금 가르친 대화를 심심이가 바로 습득한다는 점에서 신선한 흥미를 유발한 것이다. 이러한 매력이 입소문을 타면서 글로벌 AI 챗봇으로 거듭날 수 있었다는 평가다.

실제로 심심이는 특유의 커뮤니케이션 구조 덕분에 생동감 넘치는 대화를 전개하며 갈수록 더욱 많은 데이터를 확보하고 있다. 이번에 심심이가 공개하기로 한 대화 데이터의 총 수량은 약 150억 건이다. 이 가운데 한국어 대화 데이터는 약 3억 건에 이른다. 대화 데이터 유형은 사용자가 심심이에게 가르친 대화 시나리오(싱글턴), 사용자-심심이 대화 데이터(준 멀티턴), V2 서비스의 심심이-심심이 대화 데이터(멀티턴) 등으로 나뉜다.

특히 심심이는 이미 10여 년 전부터 대화 기술을 이용하고자 하는 전 세계 개발자들을 위해 API(Application Programming Interface) 제공 서비스를 오픈한 바 있다. 그 결과 3만 여 개 이상의 크고 작은 써드파티 기업 및 개인에게 제공하는 등 여러 노력을 하였다.

최근에는 개발자 사이트인 심심이 챗봇공방에서 공공성 기반 연구개발 프로젝트에 무료 제공 혹은 할인 혜택을 진행하고 있다. 이에 따라 초·중등 교육 프로그램, 박물관 도슨트, 장애인 보조를 위한 챗봇 연구 개발 등 여러 프로젝트에서 호응을 얻고 있다. 그러나 심심이 측은 API 수준의 데이터 제공만으로는 연구 시각을 다양화하는데 부족한 면이 많다고 판단했다. 따라서 원천데이터 수준의 공개를 결정했다는 설명이다.

심심이(주) 최정회 대표는 "대화형 인공지능(AI)이 최근 대세로 자리잡으면서 심심이 대화 데이터 수요가 점점 두터워지고 있는데, 특히 심심이는 국내외 학교, 연구소, 기업들과 데이터 제공관련 협력프로세스를 쌓으며 의미 있는 성과를 도출해왔다. 또한 최근에는 과학기술정보통신부(이하 과기정통부)가 주관하고 한국지능정보사회진흥원(이하 NIA)이 추진하는 2022년도 인공지능 학습 데이터 구축사업에서 한국어 블렌더봇 데이터 과제를 수행하며 공공 대화 데이터 구축에도 힘을 쏟고있다"며 "이 과정에서 한국어 챗봇 연구개발을 위한 대화 데이터가 빈약한 점이 안타까웠는데 적어도 연구자들에게는 보다 폭넓게 대화 데이터를 제공할 수 있다는 점에 착안했다."고 강조했다.

뉴스봇
🏆정보의 신⚡
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 소식 IT 소식 게시판 이용 수칙 230127 admin 19.11.15 9 49523
핫글 소식 통신 3사 2분기도 영업익 1.2조 넘길 듯 [3] update BarryWhite 24.07.15 3 339
핫글 소식 美공군, 80시간 비행 무인 정찰기 울트라 공개 [3] update BarryWhite 24.07.15 1 325
핫글 소식 에이수스 NUC 14 퍼포먼스 발표 newfile BarryWhite 24.07.15 1 108
21546 소식 MS IE11과 엣지 브라우저의 구형 TLS 지원 중단 일정 발표 뉴스봇 20.04.01 0 130
21545 소식 문혁수 LG이노텍 대표 "전장 매출 5년 내 5조원 목표...현재 2조원" 뉴스봇 24.03.21 1 130
21544 소식 티머니 업무용 교통결제 비즈페이 택시·대중교통으로 확대 뉴스봇 20.09.21 0 130
21543 소식 HDD 모터 생산업체 니덱, 씨게이트 상대로 특허 침해 소송 제기 뉴스봇 21.01.21 0 130
21542 소식 애플 창립 48주년 맞았다 BarryWhite 24.04.02 0 130
21541 소식 유튜브 AI 가짜 컨텐츠 체크 기능 업데이트 BarryWhite 24.03.19 0 130
21540 소식 AMD Navi 4C 코어, 최대 9개 셰이더 엔진과 200개 이상 CU 탑재? 뉴스봇 24.04.29 1 130
21539 소식 고동진 "내년 폴더블폰 판매 늘린다” BarryWhite 19.11.06 0 130
21538 소식 IBM 출신 블록체인 헬스케어 전문가, 삼성전자 블록체인 개발 이끈다 Aimer 20.05.29 0 130
21537 소식 인텔 13세대 코어 CPU 랩터 레이크, 10월 20일 출시? 뉴스봇 22.08.31 0 130
21536 소식 삼성 갤럭시 폴드 장기 리뷰 뉴스봇 19.10.04 0 130
21535 소식 모질라 서보 웹엔진, 리눅스재단에 새 보금자리 [2] 뉴스봇 20.11.18 0 130
21534 소식 텔레칩스, 다이얼로그와 협력해 콕핏 AP 개발 뉴스봇 20.09.15 0 130
21533 소식 의회가 미국에서 앱 차단을 고려함에 따라 정부 장치에 대한 TikTok 금지 뉴스봇 22.12.28 0 130
21532 소식 VIVO, X50 Pro에 삼성 신형 GN1 센서 채택할 것 file Stellist 20.05.20 0 130
21531 소식 "제2의 지구는 없다, 역사도 위협" 지구촌 곳곳서 기후변화대응 촉구 시위 뉴스봇 19.09.28 0 130
21530 소식 파나소닉, 풀프레임 미러리스 카메라 LUMIX S1/S5/S1R 펌웨어 업데이트 뉴스봇 21.06.23 0 130
21529 소식 [영상] 한국 디스플레이 장비사 등에 칼 꽂는 궈타이밍의 폭스콘 뉴스봇 19.11.11 0 130
21528 소식 한컴, 별도기준 3분기 영업익 84억...전년대비 32% 상승 뉴스봇 21.11.14 0 130
21527 소식 쿠팡, 네이버·카카오 제치고 도쿄올림픽 온라인 중계권 뉴스봇 21.06.21 0 130
21526 소식 대만 전기료 인상으로 선단공정 가격 높아질 듯  뉴스봇 24.04.30 0 130
21525 소식 인텔 엘더 레이크, 11세대 대비 최대 소비전력 증가 뉴스봇 21.08.09 0 130
21524 소식 이통3사, 휴대폰 할부수수료 담합 의혹에 사실무근 뉴스봇 21.03.11 0 130
21523 소식 KB증권, LG디스플레이·이노텍 애플 공급물량 큰 폭 확대 기대 BarryWhite 23.06.01 0 130
21522 소식 TSMC 시설투자 축소, 팹 가동률도 조정할 것 뉴스봇 22.11.09 0 129
21521 소식 [인텔 이노베이션] 인텔랩스, 양자컴퓨팅 경쟁서 '실리콘 스핀 큐비트'가 유리하다 뉴스봇 23.09.20 0 129
21520 소식 라이젠 9 7900 시리즈 3D V 캐시 모델, 한쪽 칩렛에만 추가 캐시 탑재 뉴스봇 23.01.06 0 129
21519 소식 MS, 아케인 오스틴, 탱고 게임웍스 등 스튜디오 4곳 폐쇄 BarryWhite 24.05.08 0 129
소식 AI 챗봇 ‘심심이’, 연구 위해 대화 데이터 공개 본격화 뉴스봇 22.08.01 0 129
21517 소식 애플 신형 아이패드, 중국 생산분 선적 시작 BarryWhite 24.03.20 0 129

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...