Question

Итак, я пытаюсь отобразить звук в изображение (спектограмму) следующим образом: * Получить данные спектра (512 образцов). * Сделать png 512 * 512 => значение пикселя в строке i и col j = амплитуда на частоте j для образца j (для создания изображения требуется около 10 секунд)

[512 выборок для спектральных данных => 43 Гц / выборка]

но результаты не так хороши (я загрузил один из них: ).

Моя цель - снабдить эти изображения изображениями сверточной нейронной сети, но с моей техникой я получаю точность 56%, что совсем нехорошо: (

Несколько советов, пожалуйста?

zambari · Answer 1 · 07 января 2019

Это выглядит грубо, как спектрограмма должна. Одним из предложений было бы переключить x (частоту) и амплитуду (цвет) в логарифмическую шкалу, это намного лучше соответствует нашему восприятию, но я не уверен, что это вообще имеет значение для нейронной сети

Как получить спектрограмму из аудиофайла?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как получить спектрограмму из аудиофайла?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов