Алгоритм выбора репрезентативных образцов для диаграммы - PullRequest
4 голосов
/ 18 марта 2012

Пример:
У меня есть 100 образцов за определенный период времени. Но я могу использовать только 10 значений, чтобы нарисовать линейный график. Какой алгоритм я могу использовать для расчета этих 10 репрезентативных значений, чтобы диаграмма выглядела одинаково, если бы я использовал все 100 точных выборок для ее построения.

Наивный алгоритм, который вычисляет среднее значение для каждых следующих 10 выборок, не очень хорошо отражает пики на графике.

1 Ответ

6 голосов
/ 18 марта 2012

Вы можете использовать алгоритм Дугласа-Пекера , чтобы получить оптимальное представление с недостаточной выборкой.

Алгоритм строит набор с недостаточной выборкой, начиная только с конечных точек исходного набора данных.На каждом шаге точка в исходном наборе данных, которая является «самой далекой» (с максимальной ошибкой) из представления с низкой выборкой, добавляется к набору с низкой выборкой.Таким образом, алгоритм включает важные пики в исходном наборе данных и создает представление минимальной ошибки с недостаточной выборкой.

Поскольку в наборе с низкой выборкой вам разрешено только 10 точек, вы можете настроить алгоритмтолько для увеличения набора с неполной выборкой до размера 10.

Если у вас есть исходный набор данных, который включает в себя слишком много пиков, вы не сможете собрать их все и удовлетворить ограничение размера.

Надеюсь, это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...