Причиной такого рода и помощи сообществу я решил первую проблему, с которой я столкнулся в моей работе, которую вы можете увидеть здесь: Основная проблема - необходим для понимания предстоящего
После того, как я использовал этоЯ хотел визуализировать распределение классов и нан-значений в функциях.Поэтому я строю это в виде гистограммы.с несколькими классами это очень удобно.
проблема в том, что у меня есть около 120 различных классов и всего 50000 объектов данных - графики не читаются с таким количеством данных.
для этого я хотел разделить визуализацию.
для каждого класса должен быть подплот, показывающий сумму значений наноструктур каждого объекта.
Данные:
CLASS FEATURE1 FEATURE2 FEATURE3
X 1 1 2
B 0 0 0
C 2 3 1
Фактический участок:
Ожидаемые участки:
Ни один из моих подходов не работал до сих пор.
- Я пытался решить ее с помощью
df.groupBy('Class').plot(kind="barh", subplots=True)
- полностью уничтожил макет и построил график для объекта, а не для класса. - Я попробовал этот подход , но если язаписать свой groupBy-df в переменную 'grouped', я могу распечатать его в идеальном формате со всей информацией, но не могу получить к нему доступ, как это сделано в решении.я всегда получаю сообщение об ошибке: «строковые индексы должны быть целыми числами»
мой подход:
grouped = df.groupby('Class')
for name, group in grouped:
group.plot.bar()
РЕДАКТИРОВАТЬ - Дополнительная информация
Данные, которые я использую, полностьюкатегорический - без числовых значений - я хочу отобразить количество нан-значений в различных функциях классов (меток) моего набора данных.