У меня есть pandas фрейм данных с двумя столбцами col1
и class
. class
является двоичным. Я хочу построить гистограмму и визуализировать процент каждого из значений class
в разных столбцах столбца col1
. Вот мои попытки:
1- Две гистограммы, по одной для каждого значения столбца class
:
df.col1[df.class == 0].hist()
df.col1[df.class == 1].hist()
2- Объедините их все (два значения класса) в один график
df.groupby('class').col1.hist(alpha=0.9)
Как видно из первых двух графиков, эти строки с class==1
редко сравниваются с другими class==0
, и когда мы их объединяем (третий график), мы не видим их эффекта ( посмотрите на эти крошечные оранжевые области на графике). Одно решение использует процент каждого значения class
в каждом бине. Я попробовал это:
df.groupby('class').col1.transform(lambda x: x/sum(x)).hist(alpha=0.9)
и, видимо, не сработало. Я ищу способ визуализации процентного значения каждого класса в разных ячейках.