Впервые задаю вопрос о переполнении стека
У меня проблемы с созданием гистограммы, которую я надеюсь отфильтровать по определенным полям. Я использую некоторые конфиденциальные данные, но я постараюсь быть максимально понятным с типом данных, которые я использую. Данные настроены в виде иерархии, например, данные таковы:
Project -> Subproject -> Sub-SubProject и значение для каждого месяца (январь, февраль, март и т. Д.), Всего 15 столбцов.
Каждая строка в csv имеет значение для каждого элемента, поэтому столбец Project имеет много повторяющихся значений, поскольку он является вершиной иерархии, а подпроект также имеет достаточно много повторяющихся значений, поскольку он на один уровень ниже.
Моя цель - создать гистограмму, которая группирует каждое уникальное значение в иерархии, имея месяцы на оси x и значения для месяцев на оси y.
Таким образом, все значения с одним и тем же проектом, подпроектом, будут сгруппированы, показывая месяцы на оси х.
Я пытался использовать библиотеку ggplot2, чтобы попытаться сгруппировать значения на основе иерархии, но она выглядит не лучшим образом и объединяет значения, а не показывает уникальное значение для записи.
plot <- ggplot(data=data, aes(x= Sub-Project, y = January, fill = Sub-SubProject)) +
geom_bar(stat="identity", position = "dodge") +
facet_grid(~Project, scales = "free_x", space = "free") +
theme(axis.text.x = element_text(angle = 90, hjust = 1)) +
geom_text(aes(label=Capacity.1),hjust=0, vjust=0)
Я хочу не использовать заливку, поскольку я хотел бы самостоятельно установить цвет, но это проблема для другого времени. Мне удалось несколько повторить то, что я ищу в Таблице, но теперь результат должен быть в R.
В общем, я бы не хотел агрегирования, а использовал бы уникальный столбец для каждой записи, сгруппированный по иерархии, о которой я говорил выше.