Я пытаюсь расшифровать real-time
разговор двух человек через микрофон с Azure's SpeechToText
когнитивным обслуживанием. Вопрос в том, какой сценарий из выборок когнитивного обслуживания лучше всего подходит для этого (я полагаю, что для этого сценария speech_recognize_continuous
выборка, но я не нашел такого случая для микрофона только из файла), и можно ли разделить результаты речи? для каждого оратора.
Результат этой демонстрации должен быть таким:
Person 1:
Person 2:
Person 1:
Person 1:
....
Speech_recognition_language = "de-DE"
Как лучше всего показать этот разговор на Windows ОС?