로그인 해주세요.

AI / 로봇 게시판 *AI / 로봇에 관해 교류하는 게시판입니다.

BarryWhite

AI NIA, AI모델 성능 평가 전면 재편···추론·감성 등 9개 지표 사용

8cd1b549929397ee6ca68af653af5ce8.jpg

 

한국지능정보사회진흥원(NIA)과 업스테이지가 공동 운영하는 ‘Open Ko-LLM 리더보드’가 시즌2로 전면 개편했다. 추론능력, 감성, 무해성, 등 9개의 새로운 지표를 적용, 성능을 측정한다. 시즌1에서는 5개 지표(4개는 허깅페이스 벤치마킹,1개는 고대 임희석 교수 마련)를 적용했다.

 

 ‘Open Ko-LLM 리더보드’는 지난해 9월 민관협력을 통해 개설한 국내 최대 개방형 한국어 LLM 평가 체계다. 산·학·연 각계 분야에서 올 7월 말 기준 1700개가 넘는 LLM 모델을 제출해 평가를 받았다. 하지만 LLM 기술이 빠르게 발전함에 따라 1년 전에 만든 리더보드 벤치마크(평가지표)의 개선 필요성이 제기됐다. NIA가 벤치마킹한 글로벌 ‘Open LLM 리더보드’를 운영 중인 허깅페이스도 지난 6월 새롭게 개편한 리더보드 시즌2를 공개한 바 있다. 

 

일각에서는 NIA '리더보드'에 대해 "자본을 투입해 일시적으로 성능을 높일 수 있다"면서 "LLM 생태계를 교란시키고 엔드 투 엔드 딜리버리 품질을 하향 평준화 시키는 이런 리더보드를 왜 운영해야 하는 지 모르겠다"는 비판적 시각도 보였다.

 

*

 

전 사실 비판 의견에 동감합니다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다😘
🥇소식게 수호자🥇미게 지박령🥉큰게 좋아🥇미코의 잡담왕🥈유게 공무원🥉할인 경보📝게시판 소유자✨️🥉에로게 심심이
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 AI AI / 로봇 게시판 이용 수칙 240418 [4] admin 24.04.18 3 261
89 AI 경찰청, AI 치안활용전략 수립 착수 [2] BarryWhite 24.08.07 0 97
88 로봇 BMW, 생산라인서 피규어AI 로봇 테스트 중 [1] BarryWhite 24.08.07 0 98
87 로봇 유명 셰프 vs AI 로봇, 누구 요리가 더 맛날까 [2] BarryWhite 24.08.08 0 164
86 AI 달리3 이미지, 하루 두 장까지 무료 BarryWhite 24.08.09 1 147
85 AI 구글 딥마인드, 인간 아마추어 수준 탁구 로봇 공개 BarryWhite 24.08.09 1 106
84 AI 오픈AI GPT-4o, 위험도 평가 결과 중간 BarryWhite 24.08.09 0 215
83 로봇 배송로봇, 횡단보도 건너고 최적 경로 찾는다 file BarryWhite 24.08.09 0 100
82 AI KT: MS 협력으로 국내 특화 LLM 출시 BarryWhite 24.08.09 0 93
81 AI AI 출력 데이터를 AI가 학습 시, 시스템 붕괴? BarryWhite 24.08.09 0 103
80 AI AI 남친과 11월 결혼하는 38세 女 [1] BarryWhite 24.08.11 0 568
79 AI 軍도 AI 챗봇 적용? [3] BarryWhite 24.08.11 0 258
78 AI AI 도입하면 오히려 생산성 떨어지고 업무량 늘어나 [2] BarryWhite 24.08.12 0 277
77 AI 구글, 제미니 1.5 플래시 사용료 최대 78% 대폭 인하 BarryWhite 24.08.12 0 149
AI NIA, AI모델 성능 평가 전면 재편···추론·감성 등 9개 지표 사용 file BarryWhite 24.08.13 0 71
75 AI 오픈AI, LLM 생성 형식 불일치 문제 해결 BarryWhite 24.08.13 0 94
74 AI 인간 능가하는 AGI, 인류 마지막 발명품 될 수 있어 [2] BarryWhite 24.08.13 0 204
73 AI 내가 강력한 지성을 가진 AI에게 시키는 것 [1] file Alternative 24.08.13 9 463
72 AI 모든 업무를 음성으로…구글, 제미나이 라이브 공개 BarryWhite 24.08.14 0 77
71 AI 美, AI로 시험관 아기 시술 자동화 도전 BarryWhite 24.08.14 0 66
70 AI 실험 및 논문 작성해주는 AI 사이언티스트 등장 BarryWhite 24.08.14 0 124
69 AI 광복절에 적절한 영상 [1] 곰장수 24.08.15 1 206
68 AI 신장결석 수술로봇 중 세계 첫 AI 탑재 BarryWhite 24.08.15 0 117
67 AI 中 AI 챗봇 토키, 美서 인기 BarryWhite 24.08.16 0 108
66 AI 긱벤치 AI 등장 BarryWhite 24.08.16 0 215
65 AI 메타 라마 3.1 미세 조정한 에르메스3 등장 BarryWhite 24.08.19 0 116

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.