Тестовая поездка Асинхронная операция преобразования текста в текст - безрезультатно - PullRequest
0 голосов
/ 08 июня 2018

Я пробую длительный метод распознавания API речи (https://cloud.google.com/speech-to-text/docs/reference/rest/v1p1beta1/speech/longrunningrecognize)) и указал все необходимые параметры, такие как:

{
  "audio": 
  {
    "uri": "gs://xyz/blabla.mp3"
  },
  "config": 
  {
    "languageCode": "en-US",
    "encoding": "AMR_WB",
    "sampleRateHertz": 16000
  }
}

Это вернуло имя, которое я могуиспользовать с операцией get (https://cloud.google.com/speech-to-text/docs/reference/rest/v1/operations/get).

В документации сказано, что объект JSON "операция", возвращаемый get, будет включать параметры, которые я не вижу в ответе.

Например, естьнет «готового» узла. Вместо этого это все, что я получаю:

{
  "name": "xxxxx",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeMetadata",
    "progressPercent": 100,
    "startTime": "2018-06-08T14:40:54.663240Z",
    "lastUpdateTime": "2018-06-08T15:05:01.161911Z"
  }
}

Любая идея, почему это так? Должно, по крайней мере, вернуть статус и, возможно, ошибку (https://cloud.google.com/speech-to-text/docs/reference/rest/v1p1beta1/operations#Operation)?

ОБНОВЛЕНИЕ: Теперь я получаю результаты. Однако проблемы с сервером? Это только временный сбой?

{
  "name": "xxxxx",
  "metadata": {
    "@type": "http://type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeMetadata …",
    "progressPercent": 100,
    "startTime": "2018-06-08T14:40:54.663240Z",
    "lastUpdateTime": "2018-06-08T15:05:01.161911Z"
  },
  "done": true,
  "error": {
    "code": 13,
    "message": "Server unavailable, please try again later."
  }
}

1 Ответ

0 голосов
/ 08 августа 2018

На первый взгляд ваш запрос смешивает неподдерживаемый формат mp3 с поддерживаемым кодированием звука (AMR_WB).

Предположим, что эта смесь в порядке.Если вы получили пустой ответ (расшифровка стенограммы не возвращена и ошибок не произошло), вероятно, кодировка в вашем файле неправильная .Проверьте некоторые шаги проверки в предыдущей ссылке, чтобы определить, есть ли проблемы с вашим звуковым файлом, например, облачная служба преобразования речи в текст в настоящее время поддерживает только один аудиоканал.

Чтобы сузить проблему, вы можете преобразовать звуковой файл, следуя рекомендациям .Этого будет достаточно, чтобы перекодировать ваш файл в кодировки FLAC или LINEAR16 без потерь с частотой дискретизации 16000 Гц или выше, однако для получения полных рекомендаций прочитайте предыдущую ссылку.

Ошибка в вашем последнем обновлении кажется временной, вы все еще сталкиваетесь с проблемой?

Если ваша проблема не исчезла с новым файлом, было бы неплохо сообщить об этой ситуации.в их трекере общественного выпуска .

С уважением!

...