Односторонний t-критерий и доверительный интервал разницы в средних - PullRequest
0 голосов
/ 30 июня 2019

Типичный критерий Стьюдента проверяет, существенно ли отличаются два образца друг от друга. Давайте предположим, что следующие два набора образцов:

x1 = [12.9, 10.2, 7.4, 7.0, 10.5, 11.9, 7.1, 9.9, 14.4, 11.3]
x2 = [10.2, 6.9, 10.9, 11.0, 10.1, 5.3, 7.5, 10.3, 9.2, 8.8]

Вопрос: Значительно ли среднее значение x1 отличается от среднего значения x2? (mu1! = mu2)

Я могу построить их 95% доверительный интервал из средств:

stats.t.interval(1 - 0.05, len(x1) - 1, loc=np.mean(x1), scale=stats.sem(x1))
>>> (8.461873578892417, 12.058126421107586)

stats.t.interval(1 - 0.05, len(x2) - 1, loc=np.mean(x2), scale=stats.sem(x2))
>>> (7.663208497074507, 10.376791502925492)

Между двумя доверительными интервалами есть совпадение, и, следовательно, выборочные значения существенно не отличаются. Мы также можем формально проверить это с помощью t-критерия, предполагая равную дисперсию:

stats.ttest_ind(x1, x2, equal_var=False)
>>> Ttest_indResult(statistic=1.245268949149111, pvalue=0.23018336828903668)

Поскольку значение p не меньше 0.05, мы не можем отвергнуть нулевую гипотезу и сделать вывод, что выборочные средние значения существенно не отличаются.

Но что, если я хочу знать, имеет ли одна группа более высокие средства, чем другая?

Вопрос: Значит ли среднее значение x1 значительно больше, чем среднее значение x2? (mu1> mu2)

Я слышал, что есть разница между двусторонним и односторонним тестом, и я думаю, что мой вопрос связан с ним. Как я могу сказать, что что-то значительно БОЛЬШЕ или МЕНЬШЕ, чем другое? Не просто что-то существенно отличается друг от друга? Как мне измерить эту разницу? Как я могу сделать это в Python?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...