Я хочу проверить, имеют ли два сигнала одинаковое распределение, но я не уверен, как интерпретировать результаты, полученные с помощью Колмогорова-Смирнова.
from scipy.stats import ks_2samp
#Result 1
ks_2samp(X, Y)
Ks_2sampResult(statistic=0.9609858416360776, pvalue=0.0)
#Result 2
ks_2samp(X, Z)
Ks_2sampResult(statistic=0.22699528054535922, pvalue=0.0)
#Result 3
ks_2samp(X, A)
Ks_2sampResult(statistic=0.0628631358154169, pvalue=2.2469873930819826e-82)
#Result 4
ks_2samp(X, B)
Ks_2sampResult(statistic=0.0060199265862611595, pvalue=0.3524473755058249)
в результате 1 значение p_value меньше 0,05, поэтому я могу отклонить нулевую гипотезу, а это значит, что они не имеют одинакового распределения?
в результатах 2 и 3 это одно и то же?
Если посмотреть на результат 4, значение p_value выше 0,05, что означает, что они поступают из одного и того же распределения?
Насколько я знаю:
D-статистика - это абсолютное максимальное расстояние двух выборок. Чем ближе это число к 0, тем больше вероятность того, что два образца были взяты из одного и того же распределения.
Значение p, возвращаемое тестом k-s, имеет такую же интерпретацию, как и другие значения p. Вы отвергаете нулевую гипотезу о том, что две выборки были взяты из одного и того же распределения, если значение p меньше вашего уровня значимости.
Как мне узнать мой уровень значимости?
Как я могу сказать, если согласно D и p_value они из одного и того же дистрибутива или нет?
Спасибо, R