로그인 해주세요.

AI / 로봇 게시판 *AI / 로봇에 관해 교류하는 게시판입니다.

BarryWhite

AI NIA, AI모델 성능 평가 전면 재편···추론·감성 등 9개 지표 사용

8cd1b549929397ee6ca68af653af5ce8.jpg

 

한국지능정보사회진흥원(NIA)과 업스테이지가 공동 운영하는 ‘Open Ko-LLM 리더보드’가 시즌2로 전면 개편했다. 추론능력, 감성, 무해성, 등 9개의 새로운 지표를 적용, 성능을 측정한다. 시즌1에서는 5개 지표(4개는 허깅페이스 벤치마킹,1개는 고대 임희석 교수 마련)를 적용했다.

 

 ‘Open Ko-LLM 리더보드’는 지난해 9월 민관협력을 통해 개설한 국내 최대 개방형 한국어 LLM 평가 체계다. 산·학·연 각계 분야에서 올 7월 말 기준 1700개가 넘는 LLM 모델을 제출해 평가를 받았다. 하지만 LLM 기술이 빠르게 발전함에 따라 1년 전에 만든 리더보드 벤치마크(평가지표)의 개선 필요성이 제기됐다. NIA가 벤치마킹한 글로벌 ‘Open LLM 리더보드’를 운영 중인 허깅페이스도 지난 6월 새롭게 개편한 리더보드 시즌2를 공개한 바 있다. 

 

일각에서는 NIA '리더보드'에 대해 "자본을 투입해 일시적으로 성능을 높일 수 있다"면서 "LLM 생태계를 교란시키고 엔드 투 엔드 딜리버리 품질을 하향 평준화 시키는 이런 리더보드를 왜 운영해야 하는 지 모르겠다"는 비판적 시각도 보였다.

 

*

 

전 사실 비판 의견에 동감합니다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다.
📝게시판 소유자(1)✨️🥇미게 지박령🥇미코의 잡담왕🥇소식게 수호자🥉에로게 심심이🥈유게 공무원🥉큰게 좋아🥉할인 경보
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 AI AI / 로봇 게시판 이용 수칙 240418 [4] admin 24.04.18 3 245
핫글 AI 내가 강력한 지성을 가진 AI에게 시키는 것 [1] file Alternative 18:56 9 224
268 AI 내가 강력한 지성을 가진 AI에게 시키는 것 [1] file Alternative 18:56 9 224
267 AI 인간 능가하는 AGI, 인류 마지막 발명품 될 수 있어 BarryWhite 17:31 0 107
266 AI 오픈AI, LLM 생성 형식 불일치 문제 해결 BarryWhite 17:03 0 55
AI NIA, AI모델 성능 평가 전면 재편···추론·감성 등 9개 지표 사용 file BarryWhite 16:56 0 50
264 AI 구글, 제미니 1.5 플래시 사용료 최대 78% 대폭 인하 BarryWhite 24.08.12 0 128
263 AI AI 도입하면 오히려 생산성 떨어지고 업무량 늘어나 [2] BarryWhite 24.08.12 0 237
262 AI 軍도 AI 챗봇 적용? [3] BarryWhite 24.08.11 0 240
261 AI AI 남친과 11월 결혼하는 38세 女 [1] BarryWhite 24.08.11 0 539
260 AI AI 출력 데이터를 AI가 학습 시, 시스템 붕괴? BarryWhite 24.08.09 0 92
259 AI KT: MS 협력으로 국내 특화 LLM 출시 BarryWhite 24.08.09 0 84
258 로봇 배송로봇, 횡단보도 건너고 최적 경로 찾는다 file BarryWhite 24.08.09 0 88
257 AI 오픈AI GPT-4o, 위험도 평가 결과 중간 BarryWhite 24.08.09 0 202
256 AI 구글 딥마인드, 인간 아마추어 수준 탁구 로봇 공개 BarryWhite 24.08.09 1 98
255 AI 달리3 이미지, 하루 두 장까지 무료 BarryWhite 24.08.09 1 134
254 로봇 유명 셰프 vs AI 로봇, 누구 요리가 더 맛날까 [2] BarryWhite 24.08.08 0 150
253 로봇 BMW, 생산라인서 피규어AI 로봇 테스트 중 [1] BarryWhite 24.08.07 0 87
252 AI 경찰청, AI 치안활용전략 수립 착수 [2] BarryWhite 24.08.07 0 89
251 AI A.I 3신기 [4] file 하늘목장 24.08.07 5 361
250 AI 오픈AI, 올해 개발자 행사서 GPT-5 발표 없다…개발자 서비스 집중 BarryWhite 24.08.06 0 126
249 AI 오픈AI, 챗GPT 표절 탐지기 개발했으나 미공개 BarryWhite 24.08.05 1 241
248 AI 이미지 생성 AI FLUX.1 등장…손 생성에 능숙 BarryWhite 24.08.05 0 151
247 AI 히타치, 생성형 AI가 쓴 보고서 잡아낸다 BarryWhite 24.08.05 0 109
246 로봇 아크테릭스, 600만원대 로봇 등산복 공개 file BarryWhite 24.08.05 2 218
245 AI 오픈AI, 美정부에 GPT-5 우선 공개 BarryWhite 24.08.04 0 365
244 AI 제미니 1.5 프로 벤치마크, 클로드3·GPT-4o 제쳐 [2] BarryWhite 24.08.02 1 253

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...