Колмогоров – Смирнов интерпретирует результаты между двумя сигналами - PullRequest
0 голосов
/ 08 ноября 2018

Я хочу проверить, имеют ли два сигнала одинаковое распределение, но я не уверен, как интерпретировать результаты, полученные с помощью Колмогорова-Смирнова.

from scipy.stats import ks_2samp

#Result 1
ks_2samp(X, Y)
Ks_2sampResult(statistic=0.9609858416360776, pvalue=0.0)

#Result 2
ks_2samp(X, Z)
Ks_2sampResult(statistic=0.22699528054535922, pvalue=0.0)

#Result 3
ks_2samp(X, A)
Ks_2sampResult(statistic=0.0628631358154169, pvalue=2.2469873930819826e-82)

#Result 4
ks_2samp(X, B)
Ks_2sampResult(statistic=0.0060199265862611595, pvalue=0.3524473755058249)

в результате 1 значение p_value меньше 0,05, поэтому я могу отклонить нулевую гипотезу, а это значит, что они не имеют одинакового распределения?

в результатах 2 и 3 это одно и то же?

Если посмотреть на результат 4, значение p_value выше 0,05, что означает, что они поступают из одного и того же распределения?

Насколько я знаю: D-статистика - это абсолютное максимальное расстояние двух выборок. Чем ближе это число к 0, тем больше вероятность того, что два образца были взяты из одного и того же распределения.

Значение p, возвращаемое тестом k-s, имеет такую ​​же интерпретацию, как и другие значения p. Вы отвергаете нулевую гипотезу о том, что две выборки были взяты из одного и того же распределения, если значение p меньше вашего уровня значимости. Как мне узнать мой уровень значимости?

Как я могу сказать, если согласно D и p_value они из одного и того же дистрибутива или нет?

Спасибо, R

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...