Question

Я использую скрипт приложения Google для асинхронного распознавания речи. Он прекрасно работает с файлами менее одной минуты, но в результате получается более длинный файл (~ 12 минут):

[18-11-18 08:19:52:104 EST] {
  "name": "5822702390902833748",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeMetadata",
    "startTime": "2018-11-18T13:19:21.769945Z",
    "lastUpdateTime": "2018-11-18T13:19:21.950214Z"
  }
}

Без "стенограммы". Я обновил свой облачный аккаунт Google до платной подписки. И это кодировка файла:

Размер файла: 15.0M Битрейт: 162k Кодировка: FLAC Информация: Обработано SoX Каналы: 1 @ 16 бит
Частота дискретизации: 16000 Гц
Replaygain: выкл
Продолжительность: 00:12: 20,65

Что мне не хватает?

parse · Answer 1 · 15 августа 2019

Звучит, что вы ничего не пропустили, вам просто нужно подождать, пока операция не будет завершена.

Обычно, если вы не используете клиентскую библиотеку речи, вы должны сделать проверку работы, чтобы получить метаданные операции, которыебудет включать в себя прогресс вашего долгосрочного распознавания.

Более подробную информацию можно найти здесь: https://cloud.google.com/speech-to-text/docs/reference/rest/v1/operations

Результат API распознавания речи Google возвращает только метаданные

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Результат API распознавания речи Google возвращает только метаданные

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы