Я хотел бы знать, поддерживает ли Microsoft Speech API на Python распознавание нескольких голосов. Я видел бета-версию SDK Speaker Recognition, но мне было интересно, была ли эта функция уже в Speech SDK или нет.
Я проверил всю документацию по методам Python SDK и провел поиск по сети и через стековый поток, если кому-то когда-нибудь понадобилось / попробовалось многократное распознавание голоса в речи в текст с использованием MS Speec, но я ничего не нашел по этому поводу.
Когда я транскрибировал аудиозапись разговора двух человек (мужчина и женщина) с помощью Microsoft Speech-to-Text, распознанный текст не разделялся при изменении голоса.