IBM Watson речь в текстовом формате WAV - PullRequest
0 голосов
/ 28 сентября 2018

Как для речи IBM watson to text требуется форматирование файла wav?Я попытался отправить Уотсону wav-файл, записанный с помощью MediaRecorder в javascript, но я получаю сообщение об ошибке "" невозможно перекодировать поток данных audio / wav -> audio / x-float-array ". Я создал wav-файл из медиа-рекордера,создание BLOB-файла, а затем файла .wav. Я могу воспроизвести свой файл .wav. Я также могу отправить сообщение watson с другим файлом wav, который я не создал, для watson, и оно транскрибирует аудиопросто отлично.

Я также пытался уменьшить частоту дискретизации аудио с 32 бит на семпл до 16 бит на семпл. Я понимаю, что IBM watson требуется 16 бит на семпл, но я предполагаю, что записи mediaRecorder с 32 битами на семпл ??мой код для этого.

   var output = new DataView(new ArrayBuffer(arrayBuffer.byteLength * 2));
                for (var i = 0; i < arrayBuffer.byteLength; i++) {
                var multiplier = arrayBuffer[i] < 0 ? 0x8000 : 0x7fff; // 16-bit signed range is -32768 to 32767
                output.setInt16(i * 2, (arrayBuffer[i] * multiplier) | 0, true); // index, value ("| 0" = convert to 32-bit int, round towards 0), littleEndian.
                 }

, где из моего блоба создается arrayBuffer. Когда я конвертирую вывод обратно в файл, я получаю ту же ошибку, что и выше.

...