Два теста KS на несвязанных массивах дают идентичные тестовые статистические данные и p-значения в Python - PullRequest
0 голосов
/ 13 февраля 2019

Я использую тест KS для двух выборок в python scipy.stats, чтобы проверить нулевую гипотезу о том, что две выборки были взяты из одного и того же распределения.У меня есть четыре массива, и я провожу тест дважды, чтобы сравнить распределения a1 против a2 и a3 против a4.Код ниже

import numpy as np
import scipy.stats as stats
a1 = np.array([0.13409962, 0.19769357, 0.09881423, 0.16722408, 0.21558872, 0.16, 0.08888889, 0.13931889, 0.15797788])
a2 = np.array([0.3, 0.11818182, 0.21111111, 0.20175439, 0.14128728, 0.15679443, 0.30563515, 0.22826087, 0.13677812])
a3 = np.array([0.1532567 , 0.04942339, 0.07905138, 0.05016722, 0.0331675 , 0.02, 0.11111111, 0.13931889, 0.])
a4 = np.array([0.06666667, 0.04545455, 0.04444444, 0.02631579, 0.03139717, 0.06097561, 0.0191022 , 0.07608696, 0.03039514])

stats.ks_2samp(a1, a2)
Ks_2sampResult(statistic=0.4444444444444444, pvalue=0.24999584817106832)
stats.ks_2samp(a3, a4)
Ks_2sampResult(statistic=0.4444444444444444, pvalue=0.24999584817106832)

Статистика теста и значения p одинаковы.Что это значит о данных или реализации в scipy?

Спасибо за вашу помощь!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...