Question

Я хочу объединить свои данные на основе поля, известного как COLLISION_ID, и подсчета каждого COLLISION_ID.

Я хочу удалить повторяющиеся идентификаторы COLLISION_ID, поскольку они имеют одинаковые координаты, но сохраняют количество вхождений в исходном наборе данных.

Мой код ниже

df2 = df1.groupby(['COLLISION_ID'])[['COLLISION_ID']].count()

Это возвращает следующее:

Я хотел бы, чтобы мои данные возвращались в виде чисел COLLISION_ID, числа и оставшихся столбцов моих данных, которые здесь не показаны (~ 40 дополнительные столбцы, которые будут отфильтрованы позже)

WeNYoBen · Answer 1 · 14 апреля 2020

Если вы говорите о фильтре, мы должны сделать transform

df1['count_col']=df1.groupby(['COLLISION_ID'])['COLLISION_ID'].transform('count')

Тогда вы можете отфильтровать df1 с количеством столбцов

Функция агрегирования для фрейма данных с сохранением строк в Pandas

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Функция агрегирования для фрейма данных с сохранением строк в Pandas

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов