Я думаю, что здесь было несколько проблем. Вам нужен блокпост, чтобы переменные были наоборот. Кроме того, вам нужно использовать переменную category
, которую вы создали в mutate вместо исходной переменной. И, наконец, вам не нужно pivot_wider
.
Некоторые значения также выходили за пределы полезного диапазона и могли быть неправильными (некоторые числа были -8), поэтому я обрезал выбросы, чтобы сделать график красивее. Вы захотите проверить исходные данные, чтобы понять, имеет ли это смысл.
pacman::p_load(RCurl, plm, tibble, ggplot2, AER, dplyr, car, arm, broom, tidyr, fastDummies, dummies)
x <- getURL("https://raw.githubusercontent.com/dothemathonthatone/maps/master/main_test.csv")
maindf <- read.csv(text = x, row.names=NULL)
maindf <- maindf %>%
mutate(category = cut(year_hh_inc,
breaks = (quantile(year_hh_inc, c(0, 1/5, 2/5, 3/5, 4/5, 1), na.rm = TRUE)),
labels = c("first_quint", "second_quint", "third_quint",
'fourth_quint', 'fifth_quint'),
include.lowest = TRUE),
vals = 1)
maindf <- maindf[maindf$fee_per_inc > 0 & maindf$fee_per_inc < 0.01, ]
box <- boxplot(maindf$fee_per_inc ~ maindf$category, col = 3:5)
Создано в 2020-03-03 с помощью представ пакет (v0.3.0)