[SOH] 생성형 인공지능(AI) 챗GPT 개발사인 오픈AI가 인터넷상 정보 이용과 관련해 저작권 및 개인 정보 침해 등으로 소송을 당했다.
지난달 28일(현지시간) ‘워싱턴포스트(WP)’ 등에 따르면 미국 로펌 클락슨은 이날 오픈AI가 인터넷에서 수집한 정보로 AI를 훈련하면서 저작권 및 인터넷 이용자의 프라이버시를 침해했다며 캘리포니아 북부 연방법원에 집단 소송을 제기했다.
클락슨은 157페이지에 달하는 소장에서 오픈AI가 인터넷에서 개인 정보를 포함한 책, 기사, 웹사이트 및 게시물 등 방대한 양의 개인 데이터를 사전 통지 및 동의 없이 ‘몰래 수집했다’고 밝혔다.
또한 "오픈AI의 정보 수집은 수백만 명에 달할 것으로 추정되는 ‘전례 없는 규모’라면서 피해자가 받을 잠재적 손해가 30억달러(약 3조9500억원)에 달한다"고 주장했다.
클락슨은 이번 소송에서 △무단정보 수잡에 기반한 오픈AI 제품의 상업적 사용을 일시적으로 동결하는 형태의 금지명령과 △ 정보를 제공당한 이들에게 ‘데이터 배당금'을 지급할 것 등도 요구했다.
클락슨의 변호사 라이언 클락슨은 이번 소송의 배경에 대해 “수집된 정보들은 대규모 언어 모델에 의해 사용될 의도가 전혀 없었다”며 “AI 알고리즘에 사용될 때 보상금을 받을 수 있는지에 대한 법원의 판단이 필요하다”고 밝혔다.
이 로펌은 과거에도 데이터 침해, 허위 광고 등 다양한 문제에 대한 집단소송을 제기한 바 있다.
이번 소송은 현재 공공 인터넷에서 얻은 데이터를 이용해 생성 인공지능(AI)을 훈련하는 것에 대한 합법 여부가 명확하지 않아 소송 결과가 향후 AI의 데이터 사용에 영향을 미칠 것으로 보인다.
AI 개발자들은 ‘공정 사용’의 개념에 따라 인터넷에서 공개된 정보를 사용하는 것은 문제가 없다는 입장이다.
그러나 WP는 공정 사용은 저작권법에서 자료가 완전히 새롭게 변경될 때에만 예외로 인정되는 개념이라고 지적했다.
공정 사용이란 표현의 자유와 기술 발전 등 특정한 상황에 한해 저작권이 있는 작업물을 허가 없이 이용할 수 있는 것을 의미한다.
최근 들어 생성형 AI 개발 기업들에 대한 법적 조치를 요구하는 소송이 점점 늘고 있다.
지난 11월에는 오픈AI와 마이크로소프트(MS)가 MS 소유의 온라인 코딩 플랫폼인 깃허브에 저장된 컴퓨터 코드를 사용해 AI 도구를 학습시킨 것에 대해 집단 소송이 제기됐다.
2월에는 이미지 판매 사이트인 게티이미지가 이미지 생성 봇을 훈련하는 과정에서 자사 사진을 무단으로 사용했다며 소규모 AI스타트업인 스태빌리티AI를 고소하기도 했다.
한상진 기자
(ⓒ SOH 희망지성 국제방송 soundofhope.kr)