Я использую это Учебное пособие Microsoft Speech-To-Text для записи пользовательских интервью UX в текстовый файл, который будет отформатирован и загружен для использования командой UX в качестве ссылок при выполнении проектных работ.Для простых записей в одно предложение это работает хорошо, но для более длинных пользовательских интервью (например, от пятнадцати минут до часа) программа пропускает целые предложения и пропускает большие фрагменты аудио.Для этого SDK не так много документации.Может ли Microsoft Speech-To-Text API обрабатывать такой сценарий использования или я должен изучить другие инструменты?