Облако Речи к тексту плохая частота дискретизации герц - PullRequest
0 голосов
/ 05 июля 2018

Попытка эмулировать звук в текст через Cloud Shell, как указано в https://codelabs.developers.google.com/codelabs/cloud-speech-intro/index.html?index=..%2F..%2Findex#0-

{
  "config": {
      "encoding":"FLAC",
      "languageCode": "en-US"
  },
  "audio": {
      "uri":"gs://cloud-samples-tests/speech/brooklyn.flac"
  }
}

Это работает. Используя ту же конфигурацию и загрузив файл brooklyn.flac, полученный из вышеуказанного документа codelabs (файл на самом деле является .wav) в корзину и вызвав этот адрес в строке «audio», возвращает следующую ошибку

{
  "error": {
    "code": 400,
    "message": "Invalid recognition 'config': bad sample rate hertz.",
    "status": "INVALID_ARGUMENT"
  }
}

Та же ошибка возникает с другими файлами, закодированными в соответствии с требованиями, изложенными в https://cloud.google.com/speech-to-text/docs/reference/rest/v1/RecognitionConfig#AudioEncoding (16 бит, 16 кГц, моно, WAV, кодирование FLAC) Кроме того, использование «sampleRateHertz» и «ENCODING_UNSPECIFIED» для вышеуказанной ссылки AudioEncoding также возвращает недопустимые ошибки аргумента. Поиск на досках по ключевым словам "config ': плохая частота дискретизации герц." без удачи Что странно, так это то, что FLAC-файл, названный в документе codelabs, является .wav при загрузке и не работает при перемещении в мое ведро. Любые идеи приветствуются - спасибо!

1 Ответ

0 голосов
/ 06 июля 2018

Документ кодовых меток немного сбивает с толку, они фактически транскрибируют файл FLAC по следующему адресу gs: //cloud-samples-tests/speech/brooklyn.flac (загрузите файл flac по адресу https://storage.cloud.google.com/speech-demo/brooklyn.flac), но для предварительного просмотра они предлагают другой файл с WAV по адресу https://storage.cloud.google.com/speech-demo/brooklyn.wav. Это потому, что не многие браузеры могут воспроизводить flac, но большинство могут воспроизводить wav. Файл WAV предназначен только для предварительного просмотра, а не для транскрипции.

Если вы положили WAV-файл в корзину, вам необходимо настроить параметры в соответствии с форматом WAV. Или вы все еще можете загрузить файл FLAC и использовать его в качестве рекомендации.

...