Итак, я пытаюсь отобразить звук в изображение (спектограмму) следующим образом:
* Получить данные спектра (512 образцов).
* Сделать png 512 * 512 => значение пикселя в строке i и col j = амплитуда на частоте j для образца j (для создания изображения требуется около 10 секунд)
[512 выборок для спектральных данных => 43 Гц / выборка]
но результаты не так хороши (я загрузил один из них: ).
Моя цель - снабдить эти изображения изображениями сверточной нейронной сети, но с моей техникой я получаю точность 56%, что совсем нехорошо: (
Несколько советов, пожалуйста?