챗GPT 개발사 오픈AI의 전직 연구원이 오픈AI가 데이터 수집과정에서 저작권법을 위반했다고 폭로했다.

23일(현지시간) 뉴욕타임스(NYT)에 따르면 오픈AI에서 약 4년간 인공지능(AI) 연구원으로 일한 수치르 발라지는 온라인 챗봇인 챗GPT를 개발 당시, 저작권은 고려하지 않고 인터넷상에 유통되는 데이터를 자유롭게 사용할 수 있다고 생각했다고 주장했다. NYT는 발라지 전 오픈AI연구원이 저작권이 있는 데이터를 활용해 기술 개발해온 AI기업들에 대해 공개적으로 발언한 내부자 중 한 명이라고 전했다.

발라지 전 오픈AI연구원은 오픈AI 재직 당시 챗GPT를 훈련하는 데 활용한 방대한 양의 인터넷 데이터를 수집하고 정리하는 업무를 담당했다. 하지만 그는 2022년 말 챗GPT가 출시된 후 고민 끝에 “오픈AI가 저작권이 있는 데이터를 무단 사용하는 것은 법을 위반하는 것”이며 “챗GPT와 같은 기술이 인터넷 세상을 해치고 있다는 결론에 도달했다”고 밝혔다. 그는 사회에 이익보다는 해를 끼칠 수 있다고 판단한 챗GPT 발전에 더는 기여하고 싶지 않아 지난 8월 오픈AI를 떠났다.

오픈AI는 성명을 내 발라지의 의견에 동의하지 않는다는 입장을 밝혔다. 오픈AI는 “공정 사용 및 관련 원칙에 의해 보호되고, 오랫동안 널리 인정된 법적 판례에 의해 뒷받침되는 방식으로 인공지능 모델을 구축한다”며 “이런 원칙은 크리에이터에게 공정한 방식이고 미국의 경쟁력에 매우 중요하다고 본다”고 반박했다.

한편 언론사들은 기사를 비롯해 인터넷에 유통되는 방대한 자료를 무단 수집해 AI 학습 등에 활용한다는 이유로 AI 기업들을 상대로 소송을 제기하고 있다. 월스트리트저널(WSJ)의 모회사인 다우존스와 뉴욕포스트는 지난 21일 AI 스타트업 ‘퍼플렉시티 AI’를 상대로 저작권 및 상표권 침해 소송을 제기했다. 뉴욕타임스(NYT)도 지난해 오픈AI가 AI 모델을 훈련하는 과정에서 자사의 콘텐츠를 도용했다며 소송을 제기한 데 이어 이달 초에는 퍼플렉시티에 저작권 침해를 중단할 것을 요구하는 내용증명을 발송했다. 시카고 트리뷴 등 8개 신문사도 지난 4월부터 오픈AI와 마이크로소프트(MS) 등을 상대로 소송을 진행 중이다.