У меня есть аудиофайл wav, который я преобразовал в одноканальный и далее в аудиоформат FLAC.
sound = AudioSegment.from_wav ("/ Users / tcssig / Downloads / sample.wav")
sound.channels 1
request.json
{
"config": {
"encoding":"FLAC",
"languageCode": "fi-FI"
},
"audio": {
"uri":"gs://g_stt/fin11.flac"
}
}
Запрос API
import requests
headers = {
'Content-Type': 'application/json',
}
params = (
('key', '****************************'),
)
data = open('/Users/tcssig/Documents/request.json', 'rb').read()
response = requests.post('https://speech.googleapis.com/v1/speech:longrunningrecognize', headers=headers, params=params, data=data)
Использование google voice to text api для генерации стенограммы дает ответ об ошибке:
{'error': {'code': 400,
'message': 'Invalid audio channel count',
'status': 'INVALID_ARGUMENT'}}
Поскольку API поддерживает канал Mono, а нестерео канал, я не могу понять, почему это происходит для одного файла аудиоканала в формате FLAC.