library(tidyverse)
library(nycflights13)
Наличие тиббла со значениями (эти значения express различия в среднем времени в эфире)
origin mean_air_time
<chr> <dbl>
1 EWR 153.
2 JFK 178.
3 LGA 118.
Как я могу в R узнать, статистически различаются ли эти различия?
То, что я пытался сделать, это (добавить дополнительный столбец со средним к полетам):
mutation <- flights %>%
group_by(origin) %>%
mutate(meanAir_time = mean(air_time, na.rm = TRUE))
Теперь пытаемся создать линейную модель, используя данные с новым столбцом
value <- lm(dep_time ~ meanAir_time, data = mutation)
Наконец, показываю результат:
coef(summary(lModel))
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1135.064406 5.33534358 212.74439 0
meanAir_time 1.420515 0.03495606 40.63716 0
Я очень обеспокоен результатом Pr(>|t|)
Видя, что этот результат > 5%
Я бы сказал, что есть существенная разница, однако, Боюсь, я делаю это правильно. Я не уверен, стоит ли мне использовать dep_time
в lm(...)