Здесь я хочу использовать sox
для преобразования файла flac в файл png спектограммы. Когда я хочу конвертировать .flac
файл, я могу использовать следующую команду
sox output.flac -n spectrogram -r -o a.png
И если я хочу преобразовать в спектрограмму N x 129 пикселей, я могу использовать следующую команду
sox output.flac -n spectrogram -Y 200 -X 50 -m -r -o spectogram.png
Однако я не совсем понимаю, что означают параметры -Y 200
и -X 50
, то есть есть ли способ, которым я могу преобразовать эти параметры в частоту дискретизации, интервал времени (в миллисекундах), а также интервал частот, как в Matlab или питон. Было бы замечательно, если бы кто-то мог ответить здесь более подробно, так как в документации в chirlu / sox не ясно указано, что это значит (или я не нашел это явно).