Google Speech API Пустой ответ - PullRequest
0 голосов
/ 31 мая 2018

Для тестов я использовал Google Пример речи API (https://cloud.google.com/speech-to-text/docs/reference/rest/v1/speech/recognize) Там я попробовал файл .ogg Этот (https://www.dropbox.com/s/lw66x3g143mtnsl/SpeechToText.ogg?dl=0) Я конвертировал аудио файл в 16000 Гц. Вот полный запрос

{
  "audio": {
  "content": " content "
  },
  "config": {
  "encoding": "OGG_OPUS",
  "languageCode": "de-DE",
  "sampleRateHertz": 16000
  }
}

Затем я преобразовал файл aduio с помощью Base64 Encoder (https://www.giftofspeed.com/base64-encoder/) Так что содержимое здесь было слишком длинным. Теперь моя проблема, я получаю только пустой ответ. Я получаю код 200, нобольше ничего

Спасибо за все ответы!

1 Ответ

0 голосов
/ 31 мая 2018

URL файла .ogg, на который вы ссылались, был закодирован кодеком Vorbis, а не Opus.Вы можете использовать opus-tools для кодирования вашего аудиофайла в файл Opus, прежде чем предоставлять его службе Google

Вот отладка, которую я использовал для идентификации вашего файла как Vorbis:

opusinfo

$ opusinfo SpeechToText.ogg 
Processing file "SpeechToText.ogg"...

Use ogginfo for more information on this file.
New logical stream (#1, serial: ffe6c0ca): type Vorbis
Logical stream 1 ended

ffmpeg

$ ffmpeg -i SpeechToText.ogg 
ffmpeg version 3.4.2 Copyright (c) 2000-2018 the FFmpeg developers
Input #0, ogg, from 'SpeechToText.ogg':
  Duration: 00:00:03.41, start: 0.000000, bitrate: 116 kb/s
    Stream #0:0: Audio: vorbis, 16000 Hz, stereo, fltp, 160 kb/s
    Metadata:
      ENCODER         : Lavc58.18.100 libvorbis
...