Вам необходимо объединить данные в категории: найти разумную ширину ячейки (например, 20 краж) и подсчитать, сколько точек данных попадает в каждую ячейку. Сравните их с ожидаемыми значениями распределения Пуассона с тем же средним. Это сравнение, необходимое для выполнения теста хи-квадрат.
Обратите внимание, что для сохранения статистической достоверности вы должны выбрать ширину корзины до того, как сравните с ожидаемыми значениями. Выберите что-то, что даст вам приличное количество значений в модальном бункере, и с подходящей скоростью уходит.
Кроме того, обрежьте (справа) тест хи-квадрат после одного или двух бинов с 0 или 1 элемент, и ожидаемое значение комфортно ниже 1.
Обработка дней недели индивидуально качественно такая же, но количественно больше. У вас есть отдельная серия корзин для каждого дня недели. Вы можете использовать одну и ту же ширину корзины для всех дней или отрегулировать ее в соответствии с интенсивностью этого дня c.
Для наглядности предположим, что вы обнаружите, что 6 корзин удобны для каждого дня , Это даст вам 42 категории (6 корзин / день * 7 дней) для вашего теста хи-квадрат.