Использование набора данных Pima Indian из здесь .
Я хотел создать простую гистограмму с двойной осью, отображающей процент примеров, отмеченных как положительный случай (в данном примере «1»).
Мне удалось построить код до определенного момента:
import matplotlib.pyplot as plt
import pandas as pd
plt.style.use('dark_background')
bins = 20 # 10,12,15,20,30,60
ax1 = data['Age'].hist(bins=bins,grid=False,alpha=0.8, histtype='bar', ec='black', color='blue')
ax2 = ax1.twinx() # instantiate a second axes that shares the same x-axis
color = 'tab:orange'
ax2.set_ylabel('Percentage of class = 1', color=color) # we already handled the x-label with ax1
ax2.plot(data['Age'],data['class'], color=color)
ax2.tick_params(axis='y', labelcolor=color)
То, что это должно показать, - это столбец кадра данных (Возраст по размеру бина, отображаемый в виде гистограммы) и частота количества единиц, которые идут с этим бином в виде процента, масштаб находится в диапазоне От 0,0% до 100% для возможных значений.
Хотя с гистограммой все в порядке, целевой «класс» буквально повсюду.