Question

Я записываю звук в веб-браузере и отправляю его на серверную часть колбы.Оттуда я хочу транскрибировать звук с помощью Watson Speech to Text.Я не могу понять, какой формат данных я получаю аудио и как конвертировать его в формат, который работает для Уотсона.

Я полагаю, что Уотсон ожидает строку байтов, такую как b '\ x0c \ xff \ x0c \ xffd.Данные, которые я получаю из браузера, выглядят как [-4 -27 -34 -9 1 -8 -1 2 10 -28], которые я не могу напрямую преобразовать в байты из-за отрицательных значений (использование bytes () дает мнеэта ошибка).

Я действительно в недоумении, какое преобразование мне нужно сделать здесь.Уотсон не возвращает никаких ошибок для любых данных, которые я выбрасываю, просто не отвечает.

Random Davis · Answer 1 · 10 апреля 2019

Эти значения должны быть хорошими, но вы должны определить, как вы хотите, чтобы они хранились, прежде чем получить их байтовое представление.

Вы просто хотите преобразовать эти значения в 2-байтовые / 16-битные целые числа со знаком, а затем получить их байтовое представление.

Что это за тип данных аудио и как мне конвертировать его в wav / l16?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Что это за тип данных аудио и как мне конвертировать его в wav / l16?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы