틱톡의 모회사인 바이트댄스가 시댄스 2.0을 출시했다. 텍스트 프롬프트 하나로 명확한 스토리, 음성, 사운드를 갖춘 짧은 동영상을 생성하는 새로운 AI 모델이다. 영상은 최대 15초까지 실행되며, 월간 활성 사용자 6억 4,200만 명을 보유한 캡컷을 통해 곧 전 세계 사용자에게 제공될 예정이다.
이번 출시로 바이트댄스는 오픈AI 및 알파벳 (GOOGL)과 직접 경쟁하게 됐다. 이들 기업도 자체 텍스트-투-비디오 도구를 제공하고 있다. 그러나 더 큰 이슈는 배포 방식으로 보인다.
시댄스 2.0은 간단한 프롬프트로 장면 전환, 음성 해설, 캐릭터 동작을 생성할 수 있다. 이 도구를 테스트한 한 영화 감독은 "스토리보드 작업은 오랫동안 인간의 사고와 혁신이 진정으로 빛을 발하는 영역으로 여겨졌다. 이제 AI가 이를 대체할 수 있다는 것이 입증됐다"고 말했다.
이 발언은 AI 동영상 도구가 얼마나 빠르게 발전하고 있는지를 보여준다. 동시에 시댄스는 이미 숏폼 동영상 제작의 중심에 있는 캡컷에 통합될 예정이다. 이는 바이트댄스에 새로운 플랫폼에 의존하지 않고 글로벌 사용자 기반을 확보할 수 있게 한다.
반면 오픈AI의 소라는 여전히 일부 사용자에게만 제한적으로 제공되고 있다. 구글의 베오는 유튜브 및 클라우드 도구에 연결돼 있다. 바이트댄스는 크리에이터들이 이미 매일 사용하는 앱 안에 AI 동영상 기능을 배치하고 있다. 그 결과 도입 속도가 더 빨라질 수 있다.
하드웨어 측면도 있다. 동영상 생성에는 막대한 컴퓨팅 파워가 필요하다. 사정에 정통한 소식통에 따르면 바이트댄스는 인도네시아에서 엔비디아 (NVDA) 블랙웰 B200 칩 7,000개 이상에 접근하는 계약을 체결할 예정이다. 엔비디아가 제조한 이 칩들은 미국 수출 통제로 인해 중국으로 직접 출하될 수 없다. 그럼에도 이번 움직임은 AI 동영상이 첨단 칩에 대한 장기 수요를 증가시킬 수 있음을 보여준다.
한편 법적 우려도 커지고 있다. 미국영화협회는 이 모델이 승인 없이 미국 저작권 보호 작품을 "대규모로" 사용했다고 밝혔다. 또한 한 영화 제작자는 이 도구가 음성 샘플을 사용하지 않았음에도 자신의 목소리와 거의 동일하게 들리는 오디오를 생성했다고 주장했다. 바이트댄스는 이후 실제 인물을 기반으로 디지털 아바타를 생성할 수 있는 기능을 중단했다.
더 넓은 관점에서 보면 AI 동영상은 콘텐츠 제작 및 편집 소프트웨어를 혼란에 빠뜨릴 수 있다. 그러나 저작권 소송과 개인정보 보호 리스크가 특히 미국에서 글로벌 출시를 늦출 수 있다.
전반적으로 시댄스 2.0은 AI 동영상이 핵심 전장이 되고 있음을 보여준다. 바이트댄스는 채팅 도구에서 선두를 달리지 못할 수 있지만, 숏폼 동영상 제작에서는 이미 수억 명의 사용자를 아우르는 기반 위에 구축하고 있다.
우리는 팁랭크스 비교 도구를 사용해 AI 동영상 생성기를 활용하는 주요 AI 기업들을 정리했다. 이는 각 주식과 더 넓은 산업에 대한 심층적인 시각을 얻는 데 유용한 도구다.
