Как построить гистограмму столбца «Applicant_Income» на основе условия другого столбца «Образование»? - PullRequest
0 голосов
/ 05 июня 2019

У меня есть CSV-файл со столбцами 'Applicant_Income'Education'. Я могу построить 'Applicant_Income', но как мне построить историю 'Applicant_Income', где 'Education' = 'Graduate'.

Я пробовал что-то в boxplot, хотел бы что-то похожее на гистограмме.

g1=df.boxplot('ApplicantIncome', by = 'Education')

1 Ответ

0 голосов
/ 05 июня 2019

Как правило, вы хотите использовать plt.hist для гистограмм.Из вашего вопроса не совсем ясно, хотите ли вы отфильтровать данные ('Education' == 'Graduate') или построить одну гистограмму для каждой группы в Education.

Давайте сгенерируем пример данных

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

df = pd.DataFrame({'ApplicantIncome': np.random.normal(500, 2000, 500),
                   'Education': np.random.choice(['Graduate', 'High School', 'Undergrad'], 500)})


    ApplicantIncome Education
0   617.660998      Undergrad
1   1335.209849     Graduate
2   -966.902454     Undergrad
3   1775.496777     High School
4   -819.677673     Undergrad

Теперь, если вы просто хотите построить отфильтрованные данные:

df_grad = df[df['Education'] == 'Graduate']
plt.hist(df_grad['ApplicantIncome'])

Если вы хотите построить одну гистограмму для каждого статуса образования:

for name, group in df.groupby('Education'):
    plt.hist(group['ApplicantIncome'], label=name)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...