Как рассчитывается air_time в наборе данных о рейсах пакета nycflights13 R - PullRequest
1 голос
/ 28 марта 2020

Я анализирую набор данных о полетах пакета nycflights13 в R.

У меня есть проблема с пониманием того, как именно рассчитывается air_time.

Мой код для просмотра данных, начиная с самых коротких рейсов:

library(nycflights13)
library(tidyverse)
view(arrange(flights, air_time))

Первая просматриваемая строка, например, содержит следующую информацию:

  • dep_time = 1355 -> 13:55
  • sched_dep_time = 1315 -> 13:15
  • dep_delay = 40 - > 40 минут задержки при отправлении
  • arr_time = 1442 -> 14: 42
  • sched_arr_time = 1411 -> 14: 11
  • arr_delay = 31 -> 31 минутная задержка по прибытии
  • air_time = 20 -> 20 минут эфирного времени

Я также Знайте, что air_time дается в минутах, как задокументировано здесь: https://cran.r-project.org/web/packages/nycflights13/nycflights13.pdf

Я бы ожидал, что air_time будет временем, прошедшим в минутах между фактическим вылетом и фактическим прибытием. Другими словами, в этом случае рейс вылетел за 5 минут до 2 часов и прибыл в 14:42, поэтому я рассчитывал на 47 минут. Тем не менее, упомянутая продолжительность составляет 20. Другие элементы данных, такие как запланированные сроки, не проясняются. Сначала я думал о разнице во времени, но это также не помогает.

Еще один косвенно связанный вопрос уже существует, но не помог мне четко определить, как определяется air_time: Почему я получаю отрицательное не эфирное время в наборе данных nycflights13

Если у вас есть подсказка, пожалуйста, дайте мне знать :)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...