Привет. Мое требование: у меня есть живой аудиопоток на входе, скажем, звонок между двумя людьми, чтобы теперь преобразовать это аудио в текст в реальном времени, выбрать определенные ключевые слова из этого извлеченного текста и вставить в базу данных.
Согласно архитектуре https://github.com/aws-samples/amazon-connect-realtime-transcription Сервис AWS Kinesis Video Streams и AWS Transcribe используются для потоковой передачи в прямом эфире, но по ссылке: https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-now-supports-real-time-transcriptions/ AWS Transcribe поддерживает прямую транскрипцию, тогда почему в этой архитектуре используется Kinesis?
Если кто-нибудь знает, пожалуйста, помогите мне понять, надеюсь, Amazon Connect может принимать живое аудио в AWS Transcribe для прямой транскрипции.