소식 구글, 사용자가 온라인서 공유한 정보 사용 'AI 모델' 학습
- BarryWhite
- 조회 수 125
- 2023.07.05. 07:58
AI 도구가 사용자의 사생활에 미칠 영향에 대한 우려가 커지는 가운데 구글은 이제 자사 AI 모델을 교육하기 위해 온라인에 게시된 모든 정보 이용자를 이용할 수 있는 권리를 보유한다고 발표하는 프라이버시 정책을 업데이트했다. 최근 프라이버시 정책 변경에 앞서 구글은 프라이버시 정책에서 “언어” 모델을 훈련시키기 위해 공공 데이터를 사용했다고 명확히 했다.
차이를 모르는 사람들에게 언어 모델은 자연어 텍스트나 언어를 분석해 생성할 수 있는 AI 모델의 유형이다. 반대로 AI 모델은 이미지 생성부터 언어 처리에 이르기까지 넓은 용어로 많은 것을 커버한다. AI 모델은 이미지, 오디오, 비디오 등 다양한 데이터 유형으로 작동할 수 있다. 구글은 업데이트된 개인 정보 보호 정책 페이지에서 “언어 모델” 대신 “AI 모델”을 조심스럽게 사용합니다.
이 회사는 “예를 들어 온라인이나 다른 공인 소스로부터 공개적으로 이용할 수 있는 정보를 수집해 구글의 AI 모델을 양성하고 구글 번역, 바드, 클라우드 AI 역량 등 제품과 기능을 구축할 수 있다”고 밝혔다 프라이버시 정책 보관 페이지. 기존에는 “언어 모델”이 구글 번역과 같은 제품을 만드는 데 사용될 것이라고 프라이버시 정책이 언급했다. 다만 구글이 이제 구글 번역을 넘어 ‘AI’를 중추로 활용해 개발될 ‘바드’, ‘클라우드 AI’ 역량 등 제품을 언급하면서 더 이상 그렇지 않다.
챗PT 개발업체인 오픈AI는 최근 공공데이터를 활용해 챗GPT 3.5, GPT 4, DALL-E, VALL-E 등 제품을 교육한 혐의로 집단소송이 접수됐으며, EU 데이터 보호 규정에 따라 기업은 개인정보를 수집·사용하기 전에 이용자의 동의를 받아야 한다. 비평가들은 오픈AI가 인터넷 데이터를 “불법” 폐기함으로써 그 규칙을 위반했다고 말한다. 구글은 이제 업데이트된 사생활 정책 이후 바로 같은 이유로 집단 소송을 당할 가능성이 높아졌다.
이번 집단소송이 구글·오픈AI 등 기업들이 인터넷 데이터를 활용해 AI 모델을 양성하는 방식을 바꿀 것인지 여부는 법원이 결정할 것이지만, 온라인으로 공유하는 정보에 대해서는 각별히 신중해야 한다.