У меня есть набор данных из 36000 строк и 51 столбца. Каждый ряд является наблюдением, а первые 50 столбцов представляют собой 50 различных признаков каждого наблюдения. 51-й столбец - это столбец со значениями 0 или 1, где 0 означает, что наблюдение принадлежит классу A, а 1 означает, что оно принадлежит классу B.
Теперь, скажем, я хочу составить гистограмму значений значений первый столбец, назовите его Feature1. Насколько я знаю, plt.hist () из matplotlib не имеет возможности рисовать 2 гистограммы на одном графике, одна из которых соответствует функциям Feature1 из класса A, а другая соответствует функциям из класса B. Кроме того, sns.distplot от Seaborn не делает этого также. Поэтому я решил попробовать пару seaborn следующим образом:
sns.pairplot(df, vars = ["Feature1"], hue= "Class", diag_kind = "hist", diag_kws= dict(alpha=0.55))
Feature1 - это имя 1-го столбца, а Class - имя последнего столбца, который содержит метки классов для каждого наблюдения. Гистограмма отображается нормально, но я бы хотел увеличить количество используемых корзин. К сожалению, я не нашел никакого способа сделать это с помощью этой конкретной функции.
Кто-нибудь знает решение этой проблемы? Спасибо