Я хочу извлечь данные выборочных байтов, которые связаны с определенной областью аудиоклипа, например, слово в аудиоклипе, чтобы я получил коллекцию данных выборки, которая относится только к определенному слову, которое затем Можно отправить через БПФ. Как я смогу идентифицировать этот набор данных из набора байтов, которые существуют для всего звукового файла? Некоторые байтовые данные из файла выглядят следующим образом после преобразования их в 2-байтовые значения, поскольку это 16-битный звуковой файл (44100 Гц, 15 с).
49150.0
43010.0
15622.0
58886.0
19460.0
35583.0
0.0
7930.0
507.0
2303.0
59897.0
39419.0
517.0
6663.0
9989.0
13055.0
9210.0
Мне известно, что эти данные находятся во временной области, и я не вижу каких-либо существенных изменений в данных, таких как набор нулей, для идентификации молчания. Смогу ли я сделать это во временной области или мне придется перенести эти данные в частотную область, а затем отфильтровать ненужные данные и выполнить обратное БПФ, чтобы получить сбор данных, которые имеют смысл. Заранее спасибо.