Я анализирую набор данных о полетах пакета nycflights13 в R.
У меня есть проблема с пониманием того, как именно рассчитывается air_time.
Мой код для просмотра данных, начиная с самых коротких рейсов:
library(nycflights13)
library(tidyverse)
view(arrange(flights, air_time))
Первая просматриваемая строка, например, содержит следующую информацию:
- dep_time = 1355 -> 13:55
- sched_dep_time = 1315 -> 13:15
- dep_delay = 40 - > 40 минут задержки при отправлении
- arr_time = 1442 -> 14: 42
- sched_arr_time = 1411 -> 14: 11
- arr_delay = 31 -> 31 минутная задержка по прибытии
- air_time = 20 -> 20 минут эфирного времени
Я также Знайте, что air_time дается в минутах, как задокументировано здесь: https://cran.r-project.org/web/packages/nycflights13/nycflights13.pdf
Я бы ожидал, что air_time будет временем, прошедшим в минутах между фактическим вылетом и фактическим прибытием. Другими словами, в этом случае рейс вылетел за 5 минут до 2 часов и прибыл в 14:42, поэтому я рассчитывал на 47 минут. Тем не менее, упомянутая продолжительность составляет 20. Другие элементы данных, такие как запланированные сроки, не проясняются. Сначала я думал о разнице во времени, но это также не помогает.
Еще один косвенно связанный вопрос уже существует, но не помог мне четко определить, как определяется air_time: Почему я получаю отрицательное не эфирное время в наборе данных nycflights13
Если у вас есть подсказка, пожалуйста, дайте мне знать :)