• 메인
    • Benzinga
    이번주 방송스케쥴

    엔비디아, 인기 유튜버 마크 브라운리 등 대규모 영상 무단 수집 의혹... `채널 영상 모두 가져와`

    Benzinga Neuro 2024-08-06 21:50:41
    엔비디아, 인기 유튜버 마크 브라운리 등 대규모 영상 무단 수집 의혹... `채널 영상 모두 가져와`
    엔비디아(NVIDIA Corp.)의 내부 메시지가 유출돼 유튜브와 다른 소스에서 AI 모델 학습을 위해 영상을 무단 수집한 정황이 드러났다. 수집된 영상에는 인기 테크 유튜버 마크 브라운리(일명 MKBHD)의 콘텐츠도 포함된 것으로 알려졌다.

    무슨 일이 있었나: 브라운리는 엔비디아의 AI 학습 관행을 논의한 유출 메시지를 공개했다. 이 메시지에 따르면 엔비디아는 유튜브와 다른 소스에서 AI 모델 학습을 위해 영상을 수집했으며, 여기에는 브라운리의 영상도 포함됐다. 이 사실은 8월 5일 404 미디어가 처음 보도했다.

    브라운리는 X(구 트위터)에 "이제 엔비디아의 유출된 슬랙 메시지에서 어느 유튜브 채널의 영상을 수집할지 논의하는 내용이 나왔다. MKBHD 영상? 그것도 가져오라고 했다"고 밝혔다.

    브라운리는 404 미디어의 저널리스트 제이슨 쾨블러의 글을 인용했다. 쾨블러는 유출된 슬랙 메시지와 문서를 통해 엔비디아의 AI 데이터 수집 규모가 하루 80년, 즉 '인간의 평생' 분량에 해당하는 영상에 달한다고 공개했다.

    Marques Brownlee's tweet

    엔비디아 직원들은 넷플릭스와 유튜브 등의 소스에서 영상을 수집해 엔비디아의 옴니버스 3D 월드 생성기, 자율주행차 시스템, 디지털 휴먼 제품을 위한 AI 모델을 학습하라는 지시를 받은 것으로 전해졌다.

    저작권이 있는 콘텐츠를 AI 모델 학습에 사용하는 것의 법적, 윤리적 문제에 대해 질문을 받자 엔비디아는 "저작권법의 문구와 정신을 완전히 준수하고 있다"고 밝혔다.

    그러나 404 미디어가 확인한 내부 대화에 따르면, 엔비디아 직원들이 학술 연구용으로 수집된 데이터셋과 유튜브 영상 사용에 관한 잠재적 법적 문제를 제기했을 때 관리자들은 회사 최고위층의 승인을 받았다고 안심시켰다.

    엔비디아는 벤징가에 "우리는 모든 콘텐츠 제작자의 권리를 존중하며, 우리의 모델과 연구 노력이 저작권법의 문구와 정신을 완전히 준수한다고 확신한다. 저작권법은 특정 표현을 보호하지만 사실, 아이디어, 데이터, 정보는 보호하지 않는다. 누구나 다른 출처에서 사실, 아이디어, 데이터, 정보를 배우고 이를 사용해 자신만의 표현을 만들 수 있다. 공정 이용 원칙도 모델 학습과 같은 변형적 목적으로 저작물을 사용할 수 있는 능력을 보호한다"고 밝혔다.

    왜 중요한가: AI 학습을 위한 콘텐츠 수집 문제는 새로운 것이 아니다. 7월에도 브라운리는 애플이 유튜브 영상을 제작자의 동의 없이 사용하는 것에 대해 우려를 표명한 바 있다. 브라운리는 이 문제가 지속될 가능성이 높다고 지적했다.

    또한 6월에는 오픈AI와 앤스로픽이 웹 스크래핑 규칙을 무시해 논란을 일으켰다. 이들은 웹사이트의 자동화된 스크래핑을 방지하도록 설계된 robots.txt 프로토콜을 우회한 것으로 알려졌다.

    9월에는 일론 머스크가 X(구 트위터)의 트윗 유료화 정책 도입의 원인으로 AI 스크래핑을 지목했다. 현재 사용자들은 트윗을 읽기 위해 계정이 필요하며, 하루 600개 이상의 게시물을 보려면 트위터 블루 구독이 필요하다.

    추가로 6월에는 레딧이 자동화된 콘텐츠 스크래핑을 차단하는 정책 업데이트를 발표해 주가가 9% 가까이 상승했다. 회사는 무단 스크래핑을 방지하기 위해 공개 콘텐츠 정책을 강화할 것이라고 강조했다.

    이미지 출처: Shutterstock

    이 기사는 벤징가 뉴로가 작성하고 카우스투브 바갈코테가 편집했다.
    이 기사는 AI로 번역되어 일부 오류가 있을 수 있습니다.