Как создать переменные факторов на основе диапазонов столбца (т. Е. <15,15-30 и т. Д.) - PullRequest
0 голосов
/ 29 марта 2019

Я делаю домашнюю работу для школы, основываясь на данных 'nycflights13' в RStudio, и мне нужно создать факторную переменную (называемую delaylevel), которая разделяет dep_delay на 4 категории (<15 мин, 15 - 30 мин, 30 - 60 мин), <60 мин) на основе другой переменной фильтра, которую я уже создал (показанной ниже), под названием flight1 и назовите эту новую переменную flight2.</p>

После того, как я это сделаю, мне нужно выяснить, какая пропорция была задержана на 15 минут или более, основываясь на flt2, используя group_by w / origin и levellevel, где я должен «устранить отсутствующий уровень задержки и суммировать функцию для подсчета».(Полагаю, я знаю, как сделать эту часть, но у меня проблемы с 1-й частью)

Любая помощь будет принята.

Необходим: пакет tidyverse и пакет nycflights13 (полеты)

1 Ответ

0 голосов
/ 29 марта 2019

Вам нужно будет поиграться с верхними и нижними границами аргумента breaks, потому что все, что находится за пределами минимального и максимального перерыва, приведено к NA. Если вы хотите, чтобы уровни факторов выглядели лучше, вы можете использовать аргумент labels

cut(fit1, breaks=c(0,15,30,60,1000))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...