Я работаю через "R for Data Science" Уикхема и Гролемана, и следующий вопрос был задан в упражнениях (В вопросе используется набор данных "nycflights13", который поставляется с предустановленной в Tidyverse) :
Используйте geom_tile () вместе с dplyr, чтобы узнать, как средние задержки в рейсах зависят от пункта назначения и месяца года.Что делает сюжет трудным для чтения?Как вы могли бы его улучшить?
Порядок действий:
Поэтому я хотел создать новую переменную с именем avg_arr_delay
и использовать ее в сочетании с эстетикой заполнения для созданияВизуальное представление.Прежде чем перейти к визуальному представлению, я попытался просмотреть указанные данные в виде таблицы.Я использовал следующую команду:
View(flights %>% count(month, dest) %>% group_by(month) %>%
mutate(avg_arr_delay = sum(arr_delay)/sum(n)))
Поэтому я подумал, что, поскольку я сгруппировал данные по месяцам, R примет это во внимание в отношении столбца arr_delay
и вычислит сумму всех записей, соответствующихв соответствующий месяц.Пример: все записи arr_delay
месяца 1 суммируются вместе и т. Д.
Но, увы, я получаю сообщение об ошибке, когда пытаюсь это сделать:
Error in View : object 'arr_delay' not found
Так что мойтеперь вопрос в том, как R интерпретирует мой код, когда я пытаюсь создать эти новые переменные?