Я выполнил тест, используя R, просто чтобы проверить, совпадают ли результаты, и они:
t.test(x=c(99, 99, 22, 77, 99, 55, 44, 33, 20, 9999, 99, 99, 99), alternative = "two.sided",
mu = 10, paired = FALSE, var.equal = FALSE, conf.level = 0.95)
data: c(99, 99, 22, 77, 99, 55, 44, 33, 20, 9999, 99, 99, 99)
t = 1.079, df = 12, p-value = 0.3018
alternative hypothesis: true mean is not equal to 10
95 percent confidence interval:
-829.9978 2498.3055
sample estimates:
mean of x
834.1538
Вы можете видеть, что значение p равно 0,3.Это действительно интересная проблема, у меня много проблем с проверкой гипотез.Прежде всего, размер выборки сильно влияет, если у вас большой размер выборки, скажем, 5000 значений, незначительные отклонения от ожидаемого значения, которое вы тестируете, будут сильно влиять на значение p, и поэтому вы отвергнете нулевую гипотезу.в большинстве случаев наличие небольших образцов делает противоположное.И здесь происходит то, что у вас большая разница в данных.
Если вы попытаетесь заменить ваши данные с [99, 99, 22, 77, 99, 55, 44, 33, 20, 9999, 99, 99, 99]
На [99, 99, 99, 99, 100, 99, 99, 99, 99, 100, 99, 100, 100]
Таку него действительно небольшая дисперсия, ваше p-значение будет намного меньше, даже если среднее значение этого значения, вероятно, ближе к 10.