OpenAI, 스칼렛 요한슨 소동 이후 `고급 음성 모드` 일부 ChatGPT 플러스 사용자에 출시
2024-07-31 17:43:09
OpenAI가 ChatGPT 플러스 사용자 중 일부 그룹을 대상으로 고급 음성 모드 출시를 시작했다고 발표했다. 이 새로운 기능은 더욱 자연스러운 실시간 대화와 감정 반응을 제공할 것으로 기대된다.
무슨 일이 있었나: OpenAI는 목요일, 소규모 ChatGPT 플러스 사용자 그룹을 대상으로 고급 음성 모드 출시를 시작했다고 밝혔다. 회사 측에 따르면 이 새로운 기능은 더욱 자연스러운 실시간 대화를 제공하고, 사용자가 언제든 대화를 중단할 수 있으며, 사용자의 감정을 감지하고 반응할 수 있다고 한다.
알파 단계의 사용자들은 이메일로 지침을 받고 모바일 앱에서 메시지를 확인할 수 있다. OpenAI는 점진적으로 더 많은 사용자에게 이 기능을 제공할 예정이며, 가을까지 모든 플러스 사용자가 이용할 수 있도록 할 계획이다. 또한 회사는 조만간 영상 및 화면 공유 기능도 출시할 예정이라고 밝혔다.
We're starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK
OpenAI는 이 첨단 기술을 수백만 명의 사용자에게 제공하기 위해 음성 대화의 안전성과 품질을 강화하는 데 주력해 왔다. 45개 언어에 걸쳐 100명 이상의 외부 레드팀과 함께 GPT-4의 음성 기능을 테스트했으며, 모델이 4개의 사전 설정된 목소리로만 말하도록 훈련시켰다.
왜 중요한가: 이번 발표는 OpenAI가 안전 문제 해결을 위해 ChatGPT의 음성 비서 기능 출시를 연기한 지 한 달 만에 나온 것이다. 회사는 특정 콘텐츠를 감지하고 거부하는 모델의 능력을 향상시키고, 사용자 경험을 개선하며, 실시간 응답을 유지하면서 수백만 사용자로 확장할 수 있도록 인프라를 준비하는 데 한 달이 더 필요했다.
이전에 OpenAI는 배우 스칼렛 요한슨(Scarlett Johansson)이 AI 기술을 사용해 자신의 목소리를 복제했다는 이유로 회사를 상대로 법적 대응에 나서면서 논란에 휩싸인 바 있다.
또한 마이크로소프트(Microsoft Corp.)(NASDAQ:MSFT)는 최근 OpenAI 모델을 자사의 애저(Azure) 클라우드 플랫폼에 통합했는데, 이는 다양한 산업에서 OpenAI의 고급 모델 채택과 통합이 증가하고 있음을 보여준다.
이미지 출처: Shutterstock
이 기사는 벤징가 뉴로(Benzinga Neuro)를 사용해 생성되었으며 푸자 라즈쿠마리(Pooja Rajkumari)가 편집했다.