Распределение Python Compare: SciPy ks_2samp p-значение всегда 0.0 - PullRequest
0 голосов
/ 01 ноября 2019

Я пытаюсь сравнить два распределения и посмотреть, похожи они или различны. Я попытался использовать ks_2samp из пакета python scipy. Вот мой код,

from scipy.stats import truncnorm
import matplotlib.pyplot as plt
from scipy import stats

def get_truncated_normal(mean=0, sd=1, low=0, upp=10):
    return truncnorm(low - mean) / sd, (upp - mean) / sd, loc=mean, scale=sd)

x1 = get_truncated_normal(mean=183, sd=50, low=1, upp=365).rvs(5722176)
x2 = get_truncated_normal(mean=175, sd=50, low=1, upp=365).rvs(5722176)
plt.hist(x1)
plt.hist(x2)
plt.show()
print(stats.ks_2samp(x1, x2))

Output:
Ks_2sampResult(statistic=0.06409554686888352, pvalue=0.0)

Почему мой вывод p-value всегда 0.0? Любая помощь действительно ценится. Спасибо!

1 Ответ

1 голос
/ 01 ноября 2019

Проверьте эту статистику. https://stats.stackexchange.com/questions/18408/two-samples-of-the-same-distribution

, что предполагает тест Колмогорова-Смирнова.

И вы можете выполнить тест KS, используя scipy.

https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.kstest.html

...