Не могу сделать Google API процесс WAV Audio - PullRequest
0 голосов
/ 06 января 2020

Я хочу транскрибировать простой звук из телефонного звонка.

В настоящее время я работаю с Speech API

const speech = require('@google-cloud/speech').v1p1beta1;

Информация об аудио, которую я пытаюсь транскрибировать :

  • Код c: PCM MU-LAW (mlaw)
  • Каналы: стерео
  • Частота дискретизации: 8000
  • Биты на выборку : 16
  • Продолжительность: 35 секунд

Я использую эту конфигурацию для API:

const requestGoogle = {
      audio: {
        uri: [ my audio location ]
      },
      config: {
        audioChannelCount: 2,
        enableSeparateRecognitionPerChannel: true,
        enableAutomaticPunctuation: true,
        languageCode,
        model: 'default',
        useEnhanced: true,
        interactionType: 'PHONE_CALL',
        encoding: 'MULAW',
        microphoneDistance: 'NEARFIELD',
        recordingDeviceType: 'PHONE_LINE',
      }
    };

При запросе этого в API я получаю 400 статус ответа с сообщением об ошибке:

{

"error": "3 INVALID_ARGUMENT: неверное распознавание 'config': неверное количество каналов."

}

Если бы кто-то мог помочь мне с этим, было бы здорово, спасибо!

1 Ответ

0 голосов
/ 08 января 2020

Преобразование кода c Данные - из кода c: PCM MU-LAW (mlaw) - в - Код c: PCM - с использованием декодера G711.

Используйте канал: Mono.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...