Результат API распознавания речи Google возвращает только метаданные - PullRequest
0 голосов
/ 18 ноября 2018

Я использую скрипт приложения Google для асинхронного распознавания речи. Он прекрасно работает с файлами менее одной минуты, но в результате получается более длинный файл (~ 12 минут):

[18-11-18 08:19:52:104 EST] {
  "name": "5822702390902833748",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeMetadata",
    "startTime": "2018-11-18T13:19:21.769945Z",
    "lastUpdateTime": "2018-11-18T13:19:21.950214Z"
  }
}

Без "стенограммы". Я обновил свой облачный аккаунт Google до платной подписки. И это кодировка файла:

Размер файла: 15.0M Битрейт: 162k Кодировка: FLAC Информация: Обработано SoX Каналы: 1 @ 16 бит
Частота дискретизации: 16000 Гц
Replaygain: выкл
Продолжительность: 00:12: 20,65

Что мне не хватает?

1 Ответ

0 голосов
/ 15 августа 2019

Звучит, что вы ничего не пропустили, вам просто нужно подождать, пока операция не будет завершена.

Обычно, если вы не используете клиентскую библиотеку речи, вы должны сделать проверку работы, чтобы получить метаданные операции, которыебудет включать в себя прогресс вашего долгосрочного распознавания.

Более подробную информацию можно найти здесь: https://cloud.google.com/speech-to-text/docs/reference/rest/v1/operations

...