У меня проблема при попытке использовать dplyr и ggplot2 для суммирования данных. У меня есть набор данных (файл Excel), который я импортировал:
df<-read.xlsx('sample.xlsx', sheet = 1)
с выборкой данных
date user vert aff browser clicks age rpc installs revenue Week Month Year
1 2017-10-25 2017-10-25 maps_1 appfocus1 Chrome 13 0 0.4436 37 5.7668 43 10 2017
2 2017-10-25 2017-10-25 maps_1 appfocus1 Chrome 1140 0 0.4436 2914 505.7040 43 10 2017
3 2017-10-25 2017-10-25 maps appfocus84 Chrome 2189 0 0.4436 7543 971.0404 43 10 2017
4 2017-10-25 2017-10-25 maps_1 appfocus1 Firefox 1 0 0.4436 6 0.4436 43 10 2017
5 2017-10-25 2017-10-25 maps_1 appfocus1 Firefox 123 0 0.4436 170 54.5628 43 10 2017
6 2017-10-25 2017-10-25 maps appfocus84 Firefox 331 0 0.4436 497 146.8316 43 10 2017
source
1 googlepartner
2 search
3 NULL
4 googlepartner
5 search
6 NULL
Приведенный ниже код берет столбец «филиал» и генерирует суммирование двух полей на основе этого столбца. Затем я создаю вычисляемое поле по «партнерской»:
UC10 <- filter(df, UCMonth == 10)
UC101 <- UC10 %>% group_by(affiliate) %>%
summarise_at(vars(revenue,installs),sum)%>%
mutate(RPI = revenue/installs)
И получите следующие данные:
# A tibble: 2 x 4
affiliate revenue installs RPI
<chr> <dbl> <dbl> <dbl>
1 appfocus1 53603. 809580 0.0662
2 appfocus84 174479. 2768181 0.0630
Затем я пытаюсь составить с помощью ggplot2 суммарный RPI с помощью ggplot2:
gcor <- ggplot(UC101, aes(x = affiliate, y = RPI)) +
geom_boxplot(color = "dark red")
Моя проблема - вывод графика. Когда я смотрю на график, я получаю следующую ошибку:
Может кто-нибудь помочь понять, почему он не показывает полный коробочный сюжет? Это действительно мой первый раз, когда я использую dplyr и ggplot2 вместе, поэтому любая помощь будет принята с благодарностью.