Я работаю с API распознавания говорящего, я успешно зарегистрировался и идентифицировал говорящего. Теперь у меня есть несколько пользователей, говорящих на аудио, Как определить несколько пользователей на аудио?
API распознавания динамика принимает в качестве входных данных только звук одного говорящего. Если у вас есть звук, включающий несколько динамиков, сначала разделите звук по динамикам. В зависимости от вашего сценария, вы можете либо использовать функцию разделения (диаризации) с двумя динамиками (https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription#speaker -разделение-диаризации ), либо использовать заданную настройку c микрофонной решетки с CTS (* 1005) *). В CTS встроена та же технология распознавания говорящего, что вам не нужно совершать отдельный вызов для службы распознавания говорящего.