Ошибка счета группы в Python Pandas - PullRequest
0 голосов
/ 03 июня 2018

У меня есть список с колонками «школа» и «очки1» и «очки2», я пытаюсь сгруппировать, чтобы получить уникальную школьную запись и сделать подсчет для оценок1 больше или равных 70 и считать для оценок2больше или равно 70. кто-нибудь может мне помочь?это ошибка, которую я получаю:

enter image description here

мой список образцов: enter image description here

Ответы [ 2 ]

0 голосов
/ 03 июня 2018

Вы можете суммировать логические значения

df.set_index('school').ge(70).sum(level=0)

                      reading_score  reading_score2
school                                             
Rosemead High School            2.0             1.0
SDDE High School                1.0             1.0
Arcadia High School             1.0             2.0

Настройка

df = pd.DataFrame([
    ['Rosemead High School', 66, 79],
    ['Rosemead High School', 94, 61],
    ['Rosemead High School', 90, 60],
    ['SDDE High School', 67, 58],
    ['SDDE High School', 97, 84],
    ['Arcadia High School', 70, 80],
    ['Arcadia High School', 50, 55],
    ['Arcadia High School', 65, 77],    
], columns=['school', 'reading_score', 'reading_score2'])
0 голосов
/ 03 июня 2018

Я думаю, что нужно сначала фильтр:

df1 = (student_df > 70).groupby(student_df['school'])['reading_score', 'reading_score2'].sum()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...