Рассчитать статистическую разницу между данными значениями - PullRequest
1 голос
/ 19 марта 2020
library(tidyverse)
library(nycflights13)

Наличие тиббла со значениями (эти значения express различия в среднем времени в эфире)

  origin mean_air_time
 <chr>      <dbl>
1 EWR         153.
2 JFK         178.
3 LGA         118.

Как я могу в R узнать, статистически различаются ли эти различия?

То, что я пытался сделать, это (добавить дополнительный столбец со средним к полетам):

mutation <- flights %>%
 group_by(origin) %>% 
 mutate(meanAir_time = mean(air_time, na.rm = TRUE))

Теперь пытаемся создать линейную модель, используя данные с новым столбцом

value <- lm(dep_time ~ meanAir_time, data = mutation)

Наконец, показываю результат:

coef(summary(lModel))

Estimate Std. Error   t value Pr(>|t|)
(Intercept)  1135.064406 5.33534358 212.74439        0
meanAir_time    1.420515 0.03495606  40.63716        0

Я очень обеспокоен результатом Pr(>|t|) Видя, что этот результат > 5% Я бы сказал, что есть существенная разница, однако, Боюсь, я делаю это правильно. Я не уверен, стоит ли мне использовать dep_time в lm(...)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...