Я хотел бы знать, поддерживает ли Microsoft Speech API на Python различие в нескольких голосах.
Я видел бета-версию SDK Speaker Recognition, но я не думаю, что она работает только для дифференциации (большего распознавания).
Когда я расшифровал аудиозапись разговора двух человек (мужчина и женщина) с помощью Microsoft Speech-to-Text, распознанный текст не изменился при изменении голоса.