Попытка эмулировать звук в текст через Cloud Shell, как указано в https://codelabs.developers.google.com/codelabs/cloud-speech-intro/index.html?index=..%2F..%2Findex#0-
{
"config": {
"encoding":"FLAC",
"languageCode": "en-US"
},
"audio": {
"uri":"gs://cloud-samples-tests/speech/brooklyn.flac"
}
}
Это работает.
Используя ту же конфигурацию и загрузив файл brooklyn.flac, полученный из вышеуказанного документа codelabs (файл на самом деле является .wav) в корзину и вызвав этот адрес в строке «audio», возвращает следующую ошибку
{
"error": {
"code": 400,
"message": "Invalid recognition 'config': bad sample rate hertz.",
"status": "INVALID_ARGUMENT"
}
}
Та же ошибка возникает с другими файлами, закодированными в соответствии с требованиями, изложенными в https://cloud.google.com/speech-to-text/docs/reference/rest/v1/RecognitionConfig#AudioEncoding (16 бит, 16 кГц, моно, WAV, кодирование FLAC)
Кроме того, использование «sampleRateHertz» и «ENCODING_UNSPECIFIED» для вышеуказанной ссылки AudioEncoding также возвращает недопустимые ошибки аргумента.
Поиск на досках по ключевым словам "config ': плохая частота дискретизации герц." без удачи
Что странно, так это то, что FLAC-файл, названный в документе codelabs, является .wav при загрузке и не работает при перемещении в мое ведро.
Любые идеи приветствуются - спасибо!