В моем наборе данных есть колонка "химиотерапия", которая имеет более 800 различных уровней. Я хочу описать наиболее распространенные, скажем, 10 типов химиотерапевтических препаратов, которые проводились каждый год.
Я не знаю, как заставить geom_bar отображать только уровни выбранных частот.
Это может быть представлено в наборе данных diamonds
, где я хотел бы отобразить только 3 наиболее распространенных уровня cut
.
library("ggplot2")
library("dplyr")
library("forcats")
diamonds %>%
ggplot(aes(x = fct_infreq(factor(cut)))) +
geom_bar(aes(y = ((..count..)/sum(..count..))*100 ))
На графике показаны частоты каждого уровень, но сказать, я хочу, чтобы отображать только топ-3?