Question

Я работаю с API распознавания говорящего, я успешно зарегистрировался и идентифицировал говорящего. Теперь у меня есть несколько пользователей, говорящих на аудио, Как определить несколько пользователей на аудио?

Kiki · Answer 1 · 22 марта 2020

API распознавания динамика принимает в качестве входных данных только звук одного говорящего. Если у вас есть звук, включающий несколько динамиков, сначала разделите звук по динамикам. В зависимости от вашего сценария, вы можете либо использовать функцию разделения (диаризации) с двумя динамиками (https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription#speaker -разделение-диаризации ), либо использовать заданную настройку c микрофонной решетки с CTS (* 1005) *). В CTS встроена та же технология распознавания говорящего, что вам не нужно совершать отдельный вызов для службы распознавания говорящего.

Как определить несколько динамиков из одного аудиофайла в Microsoft-Cognitive

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как определить несколько динамиков из одного аудиофайла в Microsoft-Cognitive

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы