Как сгруппировать по столбцам и отбросить или разделить значения в пандах? - PullRequest
0 голосов
/ 04 февраля 2019

У меня есть фрейм данных pandas с тремя столбцами.

Я хочу сгруппировать фрейм данных по столбцу 3, и он работает, но моя проблема заключается в отображении значений других столбцов.

Для первой строки значения всегда будут одинаковыми, но вместо того, чтобы отображать одно и то же значение дважды для этой строки в выводе, я хочу отобразить его только один раз, поэтому в основном отбрасываем дубликат.

Для второй строки я хочу разделить значения запятой.

Группировка по работает нормально, но я просто не могу понять, как изменить выходные данные двух других строк.

Для группировки хорошо работает только

df_2 = df.groupby(['Postcode']).sum()

, но результат, конечно, не отбрасывает повторяющиеся значения в строке 1 и не разделяет значения в строке 2 запятыми.

Извините за этот вопрос, это, вероятно, не так сложно, но я действительно не могу пока обдумать это.

1 Ответ

0 голосов
/ 04 февраля 2019

Я считаю, что вам нужно DataFrameGroupBy.agg с first и join:

df = df.groupby('col3').agg({'col1':'first', 'col2':','.join})
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...