Как получить спектрограмму из аудиофайла? - PullRequest
0 голосов
/ 06 января 2019

Итак, я пытаюсь отобразить звук в изображение (спектограмму) следующим образом: * Получить данные спектра (512 образцов). * Сделать png 512 * 512 => значение пикселя в строке i и col j = амплитуда на частоте j для образца j (для создания изображения требуется около 10 секунд)

[512 выборок для спектральных данных => 43 Гц / выборка]

но результаты не так хороши (я загрузил один из них: image).

Моя цель - снабдить эти изображения изображениями сверточной нейронной сети, но с моей техникой я получаю точность 56%, что совсем нехорошо: (

Несколько советов, пожалуйста?

1 Ответ

0 голосов
/ 07 января 2019

Это выглядит грубо, как спектрограмма должна. Одним из предложений было бы переключить x (частоту) и амплитуду (цвет) в логарифмическую шкалу, это намного лучше соответствует нашему восприятию, но я не уверен, что это вообще имеет значение для нейронной сети

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...