Я собираюсь составить сюжет, чтобы посмотреть на наиболее распространенный встречающийся FINAL_CALL_TYPE в моем наборе данных BOROUGH в Нью-Йорке. У меня есть набор данных с более чем 3 миллионами наблюдений. Я разбил это на образец 2000 года, но усовершенствовал его еще больше, чтобы он соответствовал только типу инцидента и району, в котором он произошел.
По сути, я хочу создать сюжет, который будет визуализироваться в 5 наиболее распространенных случаях. типы вызовов в каждом районе с подсчетом количества типов вызовов в каждом районе.
Ниже приводится краткий обзор того, как выглядят мои данные только с типом звонка и городом
> head(df)
FINAL_CALL_TYPE BOROUGH
1804978 INJURY BRONX
1613888 INJMAJ BROOKLYN
294874 INJURY BROOKLYN
1028374 DRUG BROOKLYN
1974030 INJURY MANHATTAN
795815 CVAC BRONX
Это показывает, сколько уникальных значений существует
> str(df)
'data.frame': 2000 obs. of 2 variables:
$ FINAL_CALL_TYPE: Factor w/ 139 levels "ABDPFC","ABDPFT",..: 50 48 50 34 50 25 17 138 28 28 ...
$ BOROUGH : Factor w/ 5 levels "BRONX","BROOKLYN",..: 1 2 2 2 3 1 4 2 4 4 ...
Это код, который я пробовал
> ggplot(df, aes(x=BOROUGH, y=FINAL_CALL_TYPE)) +
+ geom_bar(stat = 'identity') +
+ facet_grid(~BOROUGH)
и ниже - результат 
Я попробовал несколько предложений в этом сообществе, но я не нашел ни одного, который показал бы, как выполнить действие с 2 столбцами.
Было бы очень признательно, если есть кто-то, кто знает решение дляэто.
Спасибо!