아마존닷컴(NASDAQ:AMZN)이 AI 기반 애플리케이션의 실시간 음성 상호작용을 혁신할 새로운 음성 기반 AI 모델 '아마존 노바 소닉'을 공개했다. 이 시스템은 음성 이해와 음성 생성을 하나의 통합 아키텍처로 구현해 각 작업을 개별적으로 처리하는 여러 독립 모델의 필요성을 제거했다. 노바 소닉은 인식, 해석, 음성 출력을 별도의 시스템으로 처리하는 기존의 다단계 방식을 단일 통합 프레임워크로 대체해 음성 처리를 간소화했다. 이 올인원 모델은 더욱 자연스럽고 생동감 있는 상호작용을 가능하게 한다. 아마존 베드록을 통해 양방향 스트리밍 API로 접근 가능한 이 기술은 의료, 여행, 호텔 등 다양한 산업 분야를 지원할 예정이다. 아마존에 따르면 노바 소닉은 억양, 리듬, 휴지 등 음성의 미묘한 요소를 포착해 인간 대화에 가까운 수준의 민감도로 응답할 수 있다. 실시간 대화 중단에도 적응해 문맥상 적절한 시점까지 응답을 보류할 수 있다. 이러한 대화 인식 능력은 더욱 생동감 있고 몰입도 높은 ....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................