Я хочу транскрибировать простой звук из телефонного звонка.
В настоящее время я работаю с Speech API
const speech = require('@google-cloud/speech').v1p1beta1;
Информация об аудио, которую я пытаюсь транскрибировать :
- Код c: PCM MU-LAW (mlaw)
- Каналы: стерео
- Частота дискретизации: 8000
- Биты на выборку : 16
- Продолжительность: 35 секунд
Я использую эту конфигурацию для API:
const requestGoogle = {
audio: {
uri: [ my audio location ]
},
config: {
audioChannelCount: 2,
enableSeparateRecognitionPerChannel: true,
enableAutomaticPunctuation: true,
languageCode,
model: 'default',
useEnhanced: true,
interactionType: 'PHONE_CALL',
encoding: 'MULAW',
microphoneDistance: 'NEARFIELD',
recordingDeviceType: 'PHONE_LINE',
}
};
При запросе этого в API я получаю 400 статус ответа с сообщением об ошибке:
{
"error": "3 INVALID_ARGUMENT: неверное распознавание 'config': неверное количество каналов."
}
Если бы кто-то мог помочь мне с этим, было бы здорово, спасибо!