Как создать фрейм данных, объединяющий (группировать?) фрейм данных, содержащий только строки - PullRequest
0 голосов
/ 28 ноября 2018

Я хотел бы создать фрейм данных, «агрегирующий» больший набор данных.

Начало:

df:

  col1 col2 
1    A    B
2    A    C
3    A    B

и получение:

df_aggregated:

  col1  col2
1     A    B
2     A    C

без использования каких-либо вычислений (count ())

Я бы написал:

df_aggreagated = df.groupby ('col1')

но я ничего не получаю

print (df_aggregated)

"error"

любая помощь приветствуется

Ответы [ 2 ]

0 голосов
/ 28 ноября 2018

Вы можете сделать это, просто удалив дублирующиеся записи, используя функцию df.drop_duplicates:

df_aggregated = df.drop_duplicates(subset=['col1', 'col2'], keep=False)
print(df_aggregated)
   col1 col2
1    A    B
2    A    C
0 голосов
/ 28 ноября 2018

Вы можете использовать groupby с функцией:

In [849]: df.groupby('col2', as_index=False).max()
Out[849]: 
  col2 col1
0    B    A
1    C    A
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...