У меня есть набор данных, состоящий из количества просмотров страниц за 6 месяцев для 30 тыс. Клиентов.Он также состоит из следующих элементов:
- Количество используемых уникальных ОС
- Количество уникальных пользователей браузера
- Количество используемых уникальных файлов cookie Все эти числа взяты за периодиз шести месяцев.
Теперь я попытался выполнить обычный тест, используя:
from scipy.stats import normaltest
k2, p = normaltest(df)
print(p)
, который возвращает 0.0, что означает, что данные не соответствуют нормальному распределению.
Теперь я хочу знать, почему это так?Я думал, что, как правило, при увеличении размера мы видим нормальное распределение данных, так как данные имеют размер 30 КБ, я не мог понять, почему они не распределяются нормально.
Я попытался преобразовать их в Zзабить, но все равно не повезло.Могу ли я преобразовать свои данные так, чтобы у меня было нормальное распределение?Есть ли способ, с помощью которого я могу это сделать?