Как определить несколько динамиков из одного аудиофайла в Microsoft-Cognitive - PullRequest
0 голосов
/ 21 марта 2020

Я работаю с API распознавания говорящего, я успешно зарегистрировался и идентифицировал говорящего. Теперь у меня есть несколько пользователей, говорящих на аудио, Как определить несколько пользователей на аудио?

1 Ответ

1 голос
/ 22 марта 2020

API распознавания динамика принимает в качестве входных данных только звук одного говорящего. Если у вас есть звук, включающий несколько динамиков, сначала разделите звук по динамикам. В зависимости от вашего сценария, вы можете либо использовать функцию разделения (диаризации) с двумя динамиками (https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription#speaker -разделение-диаризации ), либо использовать заданную настройку c микрофонной решетки с CTS (* 1005) *). В CTS встроена та же технология распознавания говорящего, что вам не нужно совершать отдельный вызов для службы распознавания говорящего.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...