Разница в тесте средств на общую статистику pandas? - PullRequest
0 голосов
/ 02 марта 2020

Я хочу выполнить проверку разницы в средних значениях для сводной статистики двух фреймов данных.

df1[['sd']].describe()
                sd
count  5000.000000
mean      0.635558
std       0.086109
min       0.492922
25%       0.577885
50%       0.639906
75%       0.688645
max       0.800767

df2[['sd']].describe()
                sd
count  5000.000000
mean      0.640954
std       0.084459
min       0.496823
25%       0.577373
50%       0.644122
75%       0.693863
max       0.798076

Я ищу какую-то функцию, которую я могу вызвать в этой сводной статистике, чтобы сообщить мне, если моя разница в значит статистически значимо.

1 Ответ

0 голосов
/ 02 марта 2020

Если вы наблюдаете две независимые выборки из одной и той же или другой популяции, выполните t-тест для независимых выборок.

Это двусторонний тест для нулевой гипотезы о том, что две независимые выборки имеют равные средние значения.

from scipy.stats import ttest_ind

ttest_ind(df1['sd'], df2['sd'])

Выходными данными будут t-statisti c и значение p.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...