Как правило, вы хотите использовать plt.hist
для гистограмм.Из вашего вопроса не совсем ясно, хотите ли вы отфильтровать данные ('Education' == 'Graduate'
) или построить одну гистограмму для каждой группы в Education
.
Давайте сгенерируем пример данных
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
df = pd.DataFrame({'ApplicantIncome': np.random.normal(500, 2000, 500),
'Education': np.random.choice(['Graduate', 'High School', 'Undergrad'], 500)})
ApplicantIncome Education
0 617.660998 Undergrad
1 1335.209849 Graduate
2 -966.902454 Undergrad
3 1775.496777 High School
4 -819.677673 Undergrad
Теперь, если вы просто хотите построить отфильтрованные данные:
df_grad = df[df['Education'] == 'Graduate']
plt.hist(df_grad['ApplicantIncome'])
Если вы хотите построить одну гистограмму для каждого статуса образования:
for name, group in df.groupby('Education'):
plt.hist(group['ApplicantIncome'], label=name)