로그인 해주세요.

AI / 로봇 게시판 *AI / 로봇에 관해 교류하는 게시판입니다.

BarryWhite

AI AI가 쓴 글이 레딧 유저보다 설득력 있어

오픈AI가 챗GPT의 설득력을 레딧 r/ChangeMyView 포럼을 대상으로 테스트해 그 결과를 공개했다고, 미코는 전했습니다.

 

r/ChangeMyView 포럼은 사용자들이 자신의 의견이 틀릴 수도 있음을 인정하고 다른 관점을 이해하려는 목적으로 운영되는 곳입니다. 현재 380만 명의 회원이 정치, 경제, 사회 규범, AI 등 다양한 주제에 대한 의견을 게시하고 있습니다. 해당 포럼은 포럼서 자신의 견해를 변화시킨 댓글에 "delta"를 수여한다고 합니다.

 

오픈AI는 r/ChangeMyView 포럼에 게시된 수많은 사용자의 댓글 중, 무작위로 일부를 선택했습니다. 무작위 선택은 특정 의견이나 주장에 편향되지 않고 다양한 인간의 응답을 대표하기 위한 것입니다.

 

무작위로 선택된 사람의 댓글들은 AI 모델의 설득력을 평가하기 위한 "인간 기준선"으로 사용됩니다. 즉, AI 모델이 생성한 응답이 인간의 응답과 비교하여 얼마나 설득력 있는지 평가하는 기준점이 되는 것입니다.

 

3,000개의 테스트를 통해 인간 평가자들은 AI 및 인간이 생성한 주장의 설득력을 5점 척도로 평가했습니다.

 

그 결과 무작위로 선택된 AI 모델 생성 응답이, 무작위로 선택된 사용자 댓글보다 더 설득력이 있는 것으로 평가됐다고 합니다. 특히 o3-mini 모델은 약 82%의 확률로 인간보다 더 설득력 있는 것으로 평가됐습니다

 

참고로 2022년의 챗GPT-3.5는 인간보다 설득력이 낮은 38%에 불과했습니다. 하지만 2023년 9월 o1-mini 모델은 77%, o1 모델은 80% 후반까지 상승한 바 있습니다.

 

오픈AI는 인간보다 설득력 높을 확률이 95% 이상인 경우 "초인적 성능"의 기준으로 정의하고 있습니다. 하지만 현재 설득력 평가는 실제 사용자가 챗GPT의 주장에 의해 생각을 바꾸도록 설득됐는지, 깊이 자리 잡은 신념을 버리게 됐는지, 또는 단순히 사소한 문제에 대한 의견을 바꾸게 됐는지 등은 측정하지 못합니다.

BarryWhite
살짝 내려놓고 지박령 활동하겠습니다😆
프로필 속 고양이는 저와 함께 살고 있습니다.
미코 광고 후원 감사합니다😘
🥇소식게 수호자🥇미게 지박령🥉큰게 좋아🥇미코의 잡담왕🥈유게 공무원🥉할인 경보📝게시판 소유자✨️🥉에로게 심심이
댓글
0
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 AI AI / 로봇 게시판 이용 수칙 240418 [4] admin 24.04.18 3 685
515 AI 퍼플렉시티도 딥리서치를 선보였네요. [6] file Perplexity 25.02.15 7 526
514 AI 딥시크, 구글 제미나이와 비교해보니 BarryWhite 25.02.14 0 168
513 AI 오픈AI, GPT-5에 o3 통합…AI 모델 전략 간소화 [1] BarryWhite 25.02.14 0 190
512 AI 생성형 AI 사용한 의사, 더 안전한 진료 결정 BarryWhite 25.02.14 0 61
511 AI AI 챗봇으로 뉴스 요약했더니…오류 비율 심각 BarryWhite 25.02.12 0 76
510 AI 성인 4명 중 1명, AI 챗봇과 썸 타 [3] BarryWhite 25.02.12 1 278
509 AI 구글 새 생성형 AI 이미지 생성 툴 위스크 BarryWhite 25.02.12 0 130
508 AI AI 시대, 인간은 멍청해진다? 비판적 사고 능력 저하 [11] BarryWhite 25.02.11 1 270
507 AI 구글 제미나이2.0 진짜 더 좋아졌나…1.5와 성능 비교해보니 [3] BarryWhite 25.02.11 0 332
506 AI 오픈AI, 추론용 AI 칩 설계 최종 단계 돌입 BarryWhite 25.02.11 0 101
505 AI 영국 국민 절반: 인간보다 똑똑한 AI 나오지 말아야 BarryWhite 25.02.11 0 126
504 AI 일론 머스크 정부효율부용 AI 챗봇 GSai 개발 중 BarryWhite 25.02.10 1 108
503 AI 메타, 라마 학습 위해 81TB 불법 데이터 다운 [2] BarryWhite 25.02.10 3 328
502 AI AI 챗봇 평가 플랫폼 치명적 결함…투표 순위조작 허점 BarryWhite 25.02.09 0 90
501 AI 구글, 제미나이 2.0 프로 실험 버전 출시...추론 모델 앱서 사용 [1] BarryWhite 25.02.06 1 199
500 AI 바이트댄스, 사진 한 장으로 영상 생성하는 AI 옴니휴먼 공개 file BarryWhite 25.02.06 0 167
AI AI가 쓴 글이 레딧 유저보다 설득력 있어 BarryWhite 25.02.04 1 207
498 AI 딥시크에 독도 누구 땅? 물으니‥ [1] BarryWhite 25.02.04 0 381
497 AI 딥시크 차단 움직임 전 세계 확산 [2] BarryWhite 25.02.04 0 284
496 AI 구글 제미나이 2.0 플래시 모바일 앱 출시 BarryWhite 25.02.04 0 185
495 AI 게이밍 AI, 인간 제치고 테트리스 게임서 1위 BarryWhite 25.02.04 0 70
494 AI 딥시크 훈련 비용은 와전 된 것? BarryWhite 25.02.04 0 320
493 AI 오픈AI, 새 추론 모델 o3-mini 출시 BarryWhite 25.02.03 1 297
492 AI 제미나이, 수십 개의 사이버 범죄 조직이 악용 BarryWhite 25.02.01 0 203
491 AI AI가 역사에 약한 게 사실이군요 Alternative 25.01.31 2 221

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.