У меня есть следующие данные:
Category,72,78,79,99,102,123,132,175,249,258,290,291,295,312
P,0,0,0,0,0,0,0,1,0,0,0,0,0,1
P,0,0,0,1,1,0,0,0,2,2,0,1,1,0
P,3,1,1,1,0,0,0,3,2,0,0,1,1,0
P,1,1,2,0,0,0,0,0,0,0,0,0,0,0
P,0,0,1,1,1,1,1,0,1,0,1,0,1,1
P,0,0,0,1,1,0,0,0,0,0,1,0,0,0
P,1,1,2,0,0,1,3,2,1,1,1,3,1,1
P,1,0,0,0,0,0,0,0,0,0,0,0,0,0
P,1,1,0,0,0,1,1,1,0,1,2,1,0,1
P,0,0,0,0,0,1,0,0,0,1,0,0,0,0
P,0,0,0,0,1,0,0,0,0,0,0,0,0,0
P,0,0,0,0,0,0,0,0,0,0,0,0,0,0
NP,0,0,0,0,0,0,0,0,0,0,0,0,0,0
NP,0,0,0,0,0,0,0,0,0,0,0,0,0,0
NP,0,0,0,0,0,0,0,0,0,0,0,0,0,0
NP,0,0,0,0,0,0,0,0,0,0,0,0,0,0
NP,0,0,0,0,0,0,0,0,0,0,0,0,0,0
NP,0,0,0,0,0,0,0,0,0,0,0,0,0,0
NP,0,0,0,0,0,0,0,0,0,0,0,0,0,0
NP,0,0,0,0,0,0,0,0,0,0,0,0,0,0
NP,0,0,0,0,0,0,0,0,0,0,0,0,0,0
NP,0,0,0,0,0,0,1,0,0,0,0,0,0,0
NP,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Каждый образец классифицируется как "P" или "NP". Мне нужно сделать сгруппированный барплот, который показывает высоту каждого бара как сумму в категории / выборке в категории. Например, первый столбец будет помечен как «72» на оси X и будет иметь два столбца рядом (и другого цвета), один из которых отображает (7/12) * 100 в качестве высоты, а второй - в другом цвете. показывая (0/11) * 100 в качестве высоты. Я знаю, что это довольно легко, но все примеры, которые я могу найти, не группируются по столбцам и не вычисляют%.
На изображении ниже показано, что я ищу. Это действительно упрощенный набор данных. Мои реальные данные намного сложнее. Данные выше хранятся в кадре данных, называемом «informdata».