Функция агрегирования для фрейма данных с сохранением строк в Pandas - PullRequest
0 голосов
/ 14 апреля 2020

Я хочу объединить свои данные на основе поля, известного как COLLISION_ID, и подсчета каждого COLLISION_ID.

Я хочу удалить повторяющиеся идентификаторы COLLISION_ID, поскольку они имеют одинаковые координаты, но сохраняют количество вхождений в исходном наборе данных.

Мой код ниже

df2 = df1.groupby(['COLLISION_ID'])[['COLLISION_ID']].count()

Это возвращает следующее: enter image description here

Я хотел бы, чтобы мои данные возвращались в виде чисел COLLISION_ID, числа и оставшихся столбцов моих данных, которые здесь не показаны (~ 40 дополнительные столбцы, которые будут отфильтрованы позже)

1 Ответ

1 голос
/ 14 апреля 2020

Если вы говорите о фильтре, мы должны сделать transform

df1['count_col']=df1.groupby(['COLLISION_ID'])['COLLISION_ID'].transform('count')

Тогда вы можете отфильтровать df1 с количеством столбцов

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...