Быстрый алгоритм проверки однородности - PullRequest
2 голосов
/ 07 июля 2011

У меня от нуля до многих бронирований в день, и мне нужна некоторая мера того, насколько равномерно эти заказы распределяются по всему периоду времени. Бронирование может быть на полдня или на целый день.

Период времени, который я рассматриваю в этом случае, составляет один месяц.

В моих данных много пробелов: за месяц мне может быть забронировано до 25-50% дней.

Мне нужен алгоритм, который даст мне число (произвольные единицы, мне все равно: я буду просто сравнивать множество перестановок и выбираю наиболее равномерное), которое представляет единообразие бронирований.

Самое главное, мне нужно, чтобы он был достаточно быстрым, поскольку я буду запускать его много сотен раз.

Я посмотрел тесты Андерсона-Дарлинга, Крамера-кон-Мизеса и Колмогорова-Смирнова, но все они проверяют, соответствуют ли данные любому распределению. Я уверен, что есть более быстрый алгоритм, чтобы определить, являются ли данные чисто однородными.

Я кодирую на C #

1 Ответ

1 голос
/ 07 июля 2011

Надеюсь, я не слишком упрощаю ваш вопрос, но я верю, что все, что вы действительно хотите знать, это дисперсия ваших пробелов. Существует набор алгоритмов для вычисления дисперсии, каждый со своими собственными свойствами и все они довольно быстрые.

...