Обнаружение данных образца, относящихся только к определенной части звукового файла - PullRequest
0 голосов
/ 08 января 2012

Я хочу извлечь данные выборочных байтов, которые связаны с определенной областью аудиоклипа, например, слово в аудиоклипе, чтобы я получил коллекцию данных выборки, которая относится только к определенному слову, которое затем Можно отправить через БПФ. Как я смогу идентифицировать этот набор данных из набора байтов, которые существуют для всего звукового файла? Некоторые байтовые данные из файла выглядят следующим образом после преобразования их в 2-байтовые значения, поскольку это 16-битный звуковой файл (44100 Гц, 15 с).

49150.0
43010.0
15622.0
58886.0
19460.0
35583.0
0.0
7930.0
507.0
2303.0
59897.0
39419.0
517.0
6663.0
9989.0
13055.0
9210.0

Мне известно, что эти данные находятся во временной области, и я не вижу каких-либо существенных изменений в данных, таких как набор нулей, для идентификации молчания. Смогу ли я сделать это во временной области или мне придется перенести эти данные в частотную область, а затем отфильтровать ненужные данные и выполнить обратное БПФ, чтобы получить сбор данных, которые имеют смысл. Заранее спасибо.

1 Ответ

1 голос
/ 08 января 2012

Одним из способов сделать это, возможно, самым простым, является загрузка звукового файла в приложение для редактирования аудио, которое позволяет вам установить начальную и конечную точки выбора, и просто слушать и перемещать точки выбора, пока вы не услышите, что выхочу.Попытка найти точное и надежное описание тех конечных точек, которые могут быть использованы программным алгоритмом, является гораздо более сложной проблемой.

...