Сопоставление гистограммы - обработка изображений - c / c ++ - PullRequest
8 голосов
/ 27 мая 2010

У меня есть две гистограммы.

int Hist1[10] = {1,4,3,5,2,5,4,6,3,2};

int Hist1[10] = {1,4,3,15,12,15,4,6,3,2};

Хист1 имеет мультимодальный тип;

Распределение Hist2 относится к типу одномодальных с одним выраженным пиком.

Мои вопросы

  1. Есть ли способ, которым я мог бы определить тип распространения программно?
  2. Как определить, являются ли эти две гистограммы сходными / несходными?

Спасибо

Ответы [ 5 ]

1 голос
/ 14 января 2011

Радж,

Я опубликовал функцию C в вашем другом вопросе ( автоматически сравнивает две серии - тест на различие ), который вычислит расхождение между двумя наборами похожих данных. Он на самом деле предназначен для того, чтобы рассказать вам, насколько реальные данные соответствуют прогнозируемым данным, но я подозреваю, что вы можете использовать их для своих целей.

В принципе, чем меньше ошибка, тем больше сходства между двумя наборами.

1 голос
/ 28 мая 2010

Для # 2 вы можете рассчитать их взаимную корреляцию (при условии, что сами корзины могут быть отсортированы). Это даст вам приблизительную оценку того, что такое «сходство».

1 голос
/ 27 мая 2010

Это всего лишь предположения, но я бы попробовал подогнать каждое распределение как гауссовское распределение и использовать что-то вроде значения R-квадрата, чтобы определить, является ли распределение одномодальным или нет.

Что касается сходства между двумя распределениями, я бы попытался выполнить автокорреляцию и использовать пиковое положительное значение в автокорреляции в качестве меры сходства. Эти идеи довольно грубые, но, надеюсь, они дадут вам некоторые идеи.

0 голосов
/ 02 июня 2010

Существует множество программных пакетов, которые «подгонят» ваши дистрибутивы под известные вам дискретные дистрибутивы - Minitab, STATA, R и т. Д. Ссылка на подбор дистрибутивов в R здесь здесь.Я бы не советовал программировать это с нуля.

Что касается сравнений распределений, если ни один из них не соответствует известному распределению (Пуассон, Бином и т. Д.), То вам нужно использовать непараметрические методы, описанные здесь .

0 голосов
/ 28 мая 2010

Сравнение гистограмм (для использования в облачном моделировании).

(Это файл MS .doc.)

...