Алгоритм: поиск моды с несовершенными значениями - PullRequest
1 голос
/ 27 декабря 2011

Я хочу найти режим набора данных, в котором числа близки, но не точны. Например, допустим, у меня есть следующий массив:

[0,00, 100,12, 101,00, 99,75, 97,5, 102,4, 36,34, 103,11, 100,20, 75,0]

Я хочу получить число около 100 из этого массива. Я мог бы просто взять среднее, но я не хочу, чтобы 0,00, 36,34 и 75,00 испортили остальные цифры.

Еще один способ выразить это так: я хочу получить среднее значение, исключая те, которые не близки к другим.

Спасибо!

Ответы [ 2 ]

1 голос
/ 29 декабря 2011

Как насчет использования медианы вместо среднего значения?

http://en.wikipedia.org/wiki/Median

Или использования «усеченного среднего».Отбросьте верхние 10% и нижние 10% значений, рассчитайте среднее значение только для остатка.Он предположительно более стабильный.

0 голосов
/ 28 декабря 2011

Быстрое решение - вычислить гистограмму и найти ее максимум. Вы можете поиграть с размером корзины.

...