Google Cloud речь к тексту остальные API вернуть пустой ответ - PullRequest
0 голосов
/ 07 ноября 2019

Я попытался использовать Google Cloud Speech для преобразования текста в текстовый API, используя образец страницы (https://cloud.google.com/speech-to-text/).. Он прекрасно работает после загрузки аудиофайла (.m4a)

Затем я пытаюсь позвонитьэти службы используют API отдыха и тот же аудиофайл, он не работает.

Я получаю 200 с пустым ответом.

Я вызываю API остальных с этой информацией

POSThttps://speech.googleapis.com/v1p1beta1/speech:recognize?key=SOME_KEY

тело:

{
  "audio": {
    "content": "base64 audio content"
  },
  "config": {
    "sampleRateHertz": 16000,
    "encoding": "LINEAR16",
    "languageCode": "en-US"
  }
}

но на https://cloud.google.com/speech-to-text/, тело немного отличается от этого

{
  "audio": {
    "content": "/* Your audio */"
  },
  "config": {
    "enableAutomaticPunctuation": true,
    "encoding": "LINEAR16",
    "languageCode": "en-US",
    "model": "default"
  }
}

Я незнаю, почему он не работает при вызове rest API.

Пожалуйста, помогите

Обновлено =>

Я читаю аудиофайл по этому коду (пример из Google Doc)

const file = fs.readFileSync('FILE_LOCATION')
const audioBytes = file.toString('base64')

1 Ответ

1 голос
/ 08 ноября 2019

Читая документы, я не нашел ссылки на файлы .m4a (Apple Lossless), которые поддерживаются Google Text To Speech. На самом деле, все наоборот.

Я бы предложил, как минимум, попытаться преобразовать ваш файл в файл формата WAV и предоставить его. Если это работает, посмотрите, не можете ли вы получить исходный звук в таком формате.

См .:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...