Речевой текст IBM Watson "Распознать аудио" метод? - PullRequest
0 голосов
/ 19 марта 2020

Как метод recognize используется для отправки аудиофайлов в Speech-to-Text для транскрипции? Где аудио файл доступен? Где-нибудь указать путь к локальному файлу, месту хранения Google или URL-адресу для загрузки?

Документация гласит:

enter image description here

ОК, это то, что я хочу сделать! В документации сказано, что это метод:

recognize(params, [callback()])

Я вижу следующие параметры:

var params = {
  objectMode: true,
  contentType: 'audio/flac',
  model: 'en-US_BroadbandModel',
  keywords: ['colorado', 'tornado', 'tornadoes'],
  keywordsThreshold: 0.5,
  maxAlternatives: 3
};

Есть ли параметр для MediaFileUri?

1 Ответ

1 голос
/ 20 марта 2020

Ваша ссылка на документацию node.js sdk. В этом случае аудио отправляется как параметр audio, который должен быть либо NodeJS.ReadableStream, либо buffer. Вы можете создать читаемый поток из url, в этом случае вы можете добавить:


params.audio = fs.createReadStream(url);

, который потребует, чтобы URL указывал на аудиофайл, а не замаскированная веб-страница с аудиоплеером.

...