Понимание groupby () в Python Pandas - PullRequest
3 голосов
/ 21 января 2020

Я пытаюсь понять groupby () операция. Недостаточно понять, что Grouby группирует данные, потому что это только первый шаг, с ним мы делаем гораздо больше:

df = pd.DataFrame({'Animal': ['Falcon', 'Falcon', 'Parrot', 'Parrot'], 
                   'Max Speed': [380., 370., 24., 26.],  
                   'Class': ['Prey', 'Prey', 'Not Prey', 'Not Prey']}) 

In [7]: df                                                                                                                                                                                                   
Out[7]: 
   Animal  Max Speed     Class
0  Falcon      380.0      Prey
1  Falcon      370.0      Prey
2  Parrot       24.0  Not Prey
3  Parrot       26.0  Not Prey

Я знаю, что groupby () не работает с исходным набором данных, он работает с копия. Я не могу понять, как будет выглядеть код после того, как я это сделаю:

df.groupby('Class') 

Могу ли я понять это визуально? Я могу понять оригинальный фрейм данных, потому что я могу увидеть это таблица и, следовательно, представить, как операции будут go над ним. Итак, что происходит, когда мы делаем вышеупомянутую grouoby ()? Создает ли он новую серию или 2 новых столбца, один из которых «Класс», а другой - строка, содержащая все остальные значения?

Я попытался просмотреть официальное руководство пользователя документации (https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html ) но это не помогает понять, как выглядит grouby () после своей работы

1 Ответ

2 голосов
/ 21 января 2020

Я думаю, вы можете проверить this :

Объект GroupBy

Функция groupby () возвращает объект GroupBy, но по существу описывает, как строки исходного набора данных были разделены. Переменная группы объектов GroupBy - это словарь, ключами которого являются вычисленные уникальные группы, а соответствующими значениями являются метки осей, принадлежащих каждой группе.

Если вы просто запустите df.groupby ('column_for_grouping'), вы получите Python объект, который будет похож на. Возможно, вы захотите узнать, как выглядит объект DataFrameGroupBy внутри. Итак, давайте распечатаем группы по континентам внутри нашего объекта DataFrameGroupBy, перебирая группы.

...