Sarang 28 марта 2019 11

Неверное количество аудиоканалов для одноканального аудиофайла

Sarang / 28 марта 2019

У меня есть аудиофайл wav, который я преобразовал в одноканальный и далее в аудиоформат FLAC.

sound = AudioSegment.from_wav ("/ Users / tcssig / Downloads / sample.wav")

sound.channels 1

request.json

{
  "config": {
      "encoding":"FLAC",
      "languageCode": "fi-FI"
  },
  "audio": {
     "uri":"gs://g_stt/fin11.flac"
  }
}

Запрос API

import requests

headers = {
    'Content-Type': 'application/json',
}

params = (
    ('key', '****************************'),
)

data = open('/Users/tcssig/Documents/request.json', 'rb').read()
response = requests.post('https://speech.googleapis.com/v1/speech:longrunningrecognize', headers=headers, params=params, data=data)

Использование google voice to text api для генерации стенограммы дает ответ об ошибке:

{'error': {'code': 400,
  'message': 'Invalid audio channel count',
  'status': 'INVALID_ARGUMENT'}}

Поскольку API поддерживает канал Mono, а нестерео канал, я не могу понять, почему это происходит для одного файла аудиоканала в формате FLAC.

...