종목예측
  • 메인
  • NEWS
이번주 방송스케쥴

아마존, GPT-4o 능가하는 실시간 음성 AI 모델 공개

2025-04-09 00:37:22
아마존, GPT-4o 능가하는 실시간 음성 AI 모델 공개
아마존닷컴(NASDAQ:AMZN)이 AI 기반 애플리케이션의 실시간 음성 상호작용을 혁신할 새로운 음성 기반 AI 모델 '아마존 노바 소닉'을 공개했다.
이 시스템은 음성 이해와 음성 생성을 하나의 통합 아키텍처로 구현해 각 작업을 개별적으로 처리하는 여러 독립 모델의 필요성을 제거했다.
노바 소닉은 인식, 해석, 음성 출력을 별도의 시스템으로 처리하는 기존의 다단계 방식을 단일 통합 프레임워크로 대체해 음성 처리를 간소화했다.
이 올인원 모델은 더욱 자연스럽고 생동감 있는 상호작용을 가능하게 한다. 아마존 베드록을 통해 양방향 스트리밍 API로 접근 가능한 이 기술은 의료, 여행, 호텔 등 다양한 산업 분야를 지원할 예정이다.
아마존에 따르면 노바 소닉은 억양, 리듬, 휴지 등 음성의 미묘한 요소를 포착해 인간 대화에 가까운 수준의 민감도로 응답할 수 있다.
실시간 대화 중단에도 적응해 문맥상 적절한 시점까지 응답을 보류할 수 있다. 이러한 대화 인식 능력은 더욱 생동감 있고 몰입도 높은 ....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
이 기사는 AI로 번역되어 일부 오류가 있을 수 있습니다.