"초거대 AI 생태계 확장"…카카오브레인, 국내 최대 데이터셋 '코요' 공개
- 프로입털러
- 조회 수 90
- 2022.08.30. 11:25
코요, 약 7억4000만개 이미지-텍스트 데이터셋으로 구성
카카오브레인 "AI 생태계 발전에 이바지할 것"
카카오브레인 로고(카카오브레인 제공) |
카카오브레인이 초거대 인공지능(AI) 연구 개발 저변을 확대하고자 국내 최대 규모의 이미지-텍스트 데이터셋을 외부에 공개한다.
카카오브레인은 약 7억4000만개의 이미지-텍스트로 이루어진 데이터셋 '코요'(Coyo)를 카카오브레인 공식 홈페이지를 통해 오는 31일 공개한다고 30일 밝혔다. 초거대 AI 기반이자 기업의 핵심 자산인 데이터셋을 외부에 공개하는 것은 이례적이라는 평가다.
데이터셋은 초거대 AI 모델이 정교한 결괏값을 구현하는 데 필요한 핵심 요소 중 하나다. 높은 성능을 위해 많은 기업들이 수작업으로 이미지-텍스트 쌍을 맞춰 데이터셋을 수집하는데 이때 높은 비용과 많은 시간이 투입된다.
(하략)
댓글
0