Выходные данные API Google Speech меняются каждый раз для одного и того же - PullRequest
0 голосов
/ 15 декабря 2018

Выход Google Speech API меняется каждый раз для одного и того же аудиофайла.Есть ли способ получить тот же вывод или исправить модель, которую использует транскрибер?

1 Ответ

0 голосов
/ 26 февраля 2019

Вы, вероятно, используете модель "по умолчанию".Это рекомендуется для аудио.Но я узнал (и я был не один), что это не так уж и здорово.Вы лучше используете модель «видео» (это одна из усовершенствованных моделей, требующая регистрации данных).Я предлагаю вам попробовать модель видео, даже если вы транскрибируете только аудио.

Кроме того, если у вас есть общая тема в файлах, которые вы будете транскрибировать, попробуйте добавить некоторые общие фразы для API.Результаты значительно улучшаются и стабилизируются, когда вы это делаете.(ref: SpeechContext )

...