Служба Google для преобразования речи в текст имеет несколько возможных моделей для преобразования речи в текст (стандарт, видео, телефонный звонок и т. Д.).Google предоставляет документацию здесь об использовании этих моделей при отправке запросов в их текстовые API из Python или через curl.Но я использую gcloud ml speech recognize
, чтобы делать запросы к этому API, и хочу иметь возможность указать модель для использования.Я прочитал страницы и страницы документации, чтобы понять это, но пока не повезло.
Мой сценарий командной строки:
gcloud ml speech recognize test.wav --language-code=EN --useEnhanced=true
Я также пробовал --model=video
вместо--useEnhanced=true
.
Ответ Google:
ERROR: (gcloud.ml.speech.recognize) unrecognized arguments: --useEnhanced=true
To search the help text of gcloud commands, run:
gcloud help -- SEARCH_TERMS
Пожалуйста, помогите!Спасибо:)