P-значение из теста хи-квадрат - PullRequest
0 голосов
/ 29 апреля 2020

У меня есть значение хи-квадрат = 23,426, дф = 3, альфа = 0,05 (альфа - уровень значимости). Как я могу рассчитать значение р этого значения в г?

1 Ответ

1 голос
/ 29 апреля 2020

В R имеется множество функций распределения вероятностей, см. https://www.stat.umn.edu/geyer/old/5101/rlook.html

. Для вас нужна функция pchisq(), где значение p задается как

1-pchisq(23.426, 3)

На значениях p и альфа

Значение p - это вероятность вашего результата, если вы предполагаете, что нулевая гипотеза верна. Другими словами, какова вероятность того, что выборка отличается от нуля только ошибкой выборки, и нулевая гипотеза верна. Рассмотрим следующий пример; xBase - это популяция, которая не отличается от 0 (это стандартное нормальное распределение, среднее значение для населения равно 0). У нас есть нулевая гипотеза, что среднее значение в совокупности равно нулю, и мы хотим проверить, что это ноль, и (в этом случае) мы знаем, что ноль - это правда - обычно мы этого не знаем. Мы можем выбрать 50 человек, чтобы получить (ненулевое) среднее значение выборки, и выполнить тестирование, чтобы сказать нам, какова вероятность того, что нулевое значение будет истинным, с учетом нашего среднего значения и размера выборки. Проделайте это еще 20000 раз, и, используя sum(pOut), мы увидим, что 1004 выборки вернули значение p меньше 0,05, ложное положительное значение 0,0502.

set.seed(1)
# Create a base population 
xBase <- rnorm(100000,0,1)

# Repeated sampling of base population 
pOut <- vector()
for(i in 1:20000){
  # Sample that population
  xSample <- sample(xBase, 50) 
  # Perform t test (storing whether p < 0.05)
  pOut[i] <- 1 - pt(
    (mean(xSample) - 0)/(sd(xSample)/sqrt(50)), 
    50 - 1) < 0.05
}

# False positive rate 
mean(pOut)

Альфа просто сообщает, какое значение p вы считаете " статистически значимо », часто 0,05. Это означает, что если мы вычислим p и он больше, чем альфа, мы не сможем отвергнуть нулевую гипотезу. Альфа - это просто показатель ложных срабатываний, который мы принимаем, поэтому в приведенном выше примере это было 0,05. Если вы решите, что альфа равен 0,01, то вы отклоните ноль, только если p меньше 0,01. Повторяя моделирование с альфа = 0,01, было получено 186 ложных срабатываний (0,093).

set.seed(1)
# Create a base population 
xBase <- rnorm(100000,0,1)

# Repeated sampling of base population 
pOut <- vector()
for(i in 1:20000){
  # Sample that population
  xSample <- sample(xBase, 50) 
  # Perform t test (storing whether p < 0.05)
  pOut[i] <- 1 - pt(
    (mean(xSample) - 0)/(sd(xSample)/sqrt(50)), 
    50 - 1) < 0.05
}

# False positive rate 
mean(pOut)

Альфа определяет отсечение, оно не влияет на вычисление p, но оно влияет на то, что мы заключаем из п.

...