В чем разница между функцией AWS Transcribe> Streaming Transcription и видеопотоками Kinesis (для аудиовхода) для потокового аудио в режиме реального времени - PullRequest
0 голосов
/ 15 марта 2019

Привет. Мое требование: у меня есть живой аудиопоток на входе, скажем, звонок между двумя людьми, чтобы теперь преобразовать это аудио в текст в реальном времени, выбрать определенные ключевые слова из этого извлеченного текста и вставить в базу данных.

Согласно архитектуре https://github.com/aws-samples/amazon-connect-realtime-transcription Сервис AWS Kinesis Video Streams и AWS Transcribe используются для потоковой передачи в прямом эфире, но по ссылке: https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-now-supports-real-time-transcriptions/ AWS Transcribe поддерживает прямую транскрипцию, тогда почему в этой архитектуре используется Kinesis?

Если кто-нибудь знает, пожалуйста, помогите мне понять, надеюсь, Amazon Connect может принимать живое аудио в AWS Transcribe для прямой транскрипции.

1 Ответ

2 голосов
/ 15 марта 2019

Amazon Kinesis Video Streams - это сервис, который позволяет передавать голосовые данные из Amazon Connect.Amazon Transcribe может принимать потоки из любого источника для транскрипции в реальном времени, но единственный способ получить эти данные в реальном времени из Amazon Connect - через Kinesis. объявление о запуске для потоков в реальном времени может помочь сделать это более ясным:

Благодаря функции голосового потока клиента ваш клиентский аудио автоматически отправляется в Amazon Kinesis Video Streams, гдедоступ к нему можно получить с помощью разрешенных вами интеграций.Например, вы можете интегрировать голосовой поток клиента с транскрипцией текста в реальном времени и анализом настроения для немедленной обратной связи о качестве звонка или использовать эту функцию с голосовым биометрическим продуктом стороннего производителя для автоматической аутентификации звонящего без необходимости ввода пароля или подтверждения личногоинформация.

...