애플이 유튜브 영상을 크리에이터 동의 없이 AI 모델 학습에 사용했다는 의혹이 제기됐다.
유명 테크 유튜버 마크 브라운리(MKBHD)는 소셜미디어를 통해 애플의 유튜브 콘텐츠 AI 학습 사용에 대한 우려를 표명했다.
브라운리는 애플이 여러 회사로부터 데이터를 확보했고, 그 중 한 회사가 자신의 영상을 포함한 유튜브 영상의 데이터와 트랜스크립트를 수집했다고 밝혔다. 브라운리는 이 회사들이 데이터 수집에 대해 직접적인 책임은 없지만, 이 문제가 오랫동안 지속될 것이라고 지적했다.
브라운리는 "애플은 기술적으로 직접 데이터를 수집하지 않아 '책임'을 피할 수 있지만, 이는 앞으로 오랫동안 진화할 문제가 될 것"이라고 말했다.
그는 또 다른 게시물에서 "재미있는 사실은 내 영상의 더 정확한 트랜스크립트를 위해 서비스에 비용을 지불하고 이를 유튜브 백엔드에 업로드한다는 것이다. 따라서 트랜스크립트를 수집하는 회사들은 한 가지 이상의 방식으로 유료 작업을 훔치고 있다. 좋지 않다"고 덧붙였다.
브라운리가 공유한 9to5Mac의 보고서에 따르면, 애플을 비롯한 여러 기술 대기업들이 제3자가 17만 개 이상의 영상에서 다운로드한 자막 파일을 사용해 AI 모델을 학습시켰다고 한다. 이 데이터에는 브라운리, 미스터비스트, 퓨디파이, 스티븐 콜버트, 존 올리버, 지미 키멜 등 크리에이터들의 영상 트랜스크립트가 포함됐다.
프루프 뉴스의 조사에 따르면 엘루서AI의 데이터셋인 '파일'이 엔비디아와 세일즈포스 등 주요 기업들의 AI 학습에 사용됐다.
기업들은 유튜브의 규정이 플랫폼에서 무단으로 자료를 수집하는 것을 금지하고 있음에도 이러한 관행을 추구했다.
애플과 엔비디아, 구글, 앤트로픽은 벤징가의 논평 요청에 즉각 응답하지 않았다.
AI 학습을 위한 무단 콘텐츠 수집 문제는 기술 업계에서 점점 더 큰 우려를 낳고 있다. 최근 오픈AI와 앤트로픽이 웹 스크래핑 규칙을 무시해 논란을 일으켰다. 이 회사들은 웹사이트의 자동화된 스크래핑을 방지하도록 설계된 robots.txt 프로토콜을 우회한 것으로 알려졌다.
이런 관행에 대응해 레딧은 최근 자동화된 콘텐츠 스크래핑을 차단하도록 플랫폼을 업데이트했다. 이 정책 변경으로 레딧 주가가 약 9% 급등해 데이터 프라이버시 문제에 대한 시장의 민감도를 보여줬다.
앞서 메타플랫폼스도 데이터 스크래핑 문제에 직면해 중국 기업을 상대로 법적 조치를 취한 바 있다. 이는 다양한 소셜 미디어 플랫폼에서 이 문제가 만연해 있음을 보여준다.
또한 일론 머스크는 AI 스크래핑을 X(구 트위터)에서 트윗 유료화를 실시한 이유로 언급했다. 이제 사용자들은 트윗을 읽으려면 계정이 필요하고, 하루 600개 이상의 게시물을 보려면 트위터 블루 구독료를 지불해야 한다.

이 기사는 벤징가 뉴로에 의해 생성되었으며 카우스투브 바갈코테가 편집했다.