Что это за тип данных аудио и как мне конвертировать его в wav / l16? - PullRequest
0 голосов
/ 09 апреля 2019

Я записываю звук в веб-браузере и отправляю его на серверную часть колбы.Оттуда я хочу транскрибировать звук с помощью Watson Speech to Text.Я не могу понять, какой формат данных я получаю аудио и как конвертировать его в формат, который работает для Уотсона.

Я полагаю, что Уотсон ожидает строку байтов, такую ​​как b '\ x0c \ xff \ x0c \ xffd.Данные, которые я получаю из браузера, выглядят как [-4 -27 -34 -9 1 -8 -1 2 10 -28], которые я не могу напрямую преобразовать в байты из-за отрицательных значений (использование bytes () дает мнеэта ошибка).

Я действительно в недоумении, какое преобразование мне нужно сделать здесь.Уотсон не возвращает никаких ошибок для любых данных, которые я выбрасываю, просто не отвечает.

1 Ответ

1 голос
/ 10 апреля 2019

Эти значения должны быть хорошими, но вы должны определить, как вы хотите, чтобы они хранились, прежде чем получить их байтовое представление.

Вы просто хотите преобразовать эти значения в 2-байтовые / 16-битные целые числа со знаком, а затем получить их байтовое представление.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...