Как визуализировать аудиоданные? - PullRequest
11 голосов
/ 24 июня 2009

Я бы хотел что-то похожее на это. Два разных цвета не обязательно.

audacity on mac
(источник: sourceforge.net )

У меня уже есть аудиоданные (один сэмпл / миллисекунда) из стереофонического wav-файла в двух массивах int, по одному для левого и правого каналов. Я сделал несколько попыток, но они нигде не выглядят так ясно, как мои попытки получить spikey или компактный ком.

Есть хорошие предложения? Я работаю в C #, но с psuedocode все в порядке.

Предположим, у нас есть

  • функция DrawLine (цветная, х1, у1, х2, у2)
  • два целых массива с данными справа [] и слева [] длины L
  • значения данных между 32767 и -32768

Если вы делаете какие-либо другие предположения, просто запишите их в своем ответе.

for(i = 0; i < L - 1; i++) {
  // What magic goes here?
}

Вот так получилось, когда я применил решение, которое Хан предоставил . (только один канал)
альтернативный текст http://www.imagechicken.com/uploads/1245877759099921200.jpg

Ответы [ 2 ]

2 голосов
/ 24 июня 2009

Скорее всего, у вас будет более 1 выборки для каждого пикселя. Для каждой группы семплов, сопоставленных с одним пикселем, вы можете нарисовать (вертикальный) отрезок линии от минимального значения в группе семплов до максимального значения. Если вы увеличите до 1 выборки на пиксель или меньше, это больше не работает, и «хорошим» решением было бы отобразить интерполированные значения sinc. Поскольку DrawLine не может рисовать один пиксель, существует небольшая проблема, когда минимальное и максимальное значения совпадают. В этом случае вы можете скопировать однопиксельное изображение в нужную позицию, как показано в коде ниже:

double samplesPerPixel = (double)L / _width;
double firstSample = 0;
int endSample = firstSample + L - 1;
for (short pixel = 0; pixel < _width; pixel++)
{
    int lastSample = __min(endSample, (int)(firstSample + samplesPerPixel));
    double Y = _data[channel][(int)firstSample];
    double minY = Y;
    double maxY = Y;
    for (int sample = (int)firstSample + 1; sample <= lastSample; sample++)
    {
        Y = _data[channel][sample];
        minY = __min(Y, minY);
        maxY = __max(Y, maxY);
    }
    x = pixel + _offsetx;
    y1 = Value2Pixel(minY);
    y2 = Value2Pixel(maxY);
    if (y1 == y2)
    {
        g->DrawImageUnscaled(bm, x, y1);
    }
    else
    {
        g->DrawLine(pen, x, y1, x, y2);
    }
    firstSample += samplesPerPixel;
}

Обратите внимание, что Value2Pixel масштабирует значение выборки до значения в пикселях (в направлении y).

0 голосов
/ 24 июня 2009

Возможно, вы захотите посмотреть на язык R . У меня не очень много опыта с этим, но он в основном используется в сценариях статистического анализа / визуализации. Я был бы удивлен, если бы у них не было некоторой функции сглаживания, чтобы избавиться от крайностей, как вы упомянули.

И у вас не должно возникнуть проблем с импортом в него ваших данных. Вы можете не только читать плоские текстовые файлы, но и разрабатывать их так, чтобы их можно было легко расширять с помощью C, поэтому, вероятно, существует также некоторый интерфейс C #.

...