Панды получают целочисленные ключи после группового - PullRequest
0 голосов
/ 25 мая 2018

У меня есть группа с несколькими столбцами, а ключи содержат все столбцы, что затрудняет чтение выходных данных ... Вот пример

import pandas as pd
import numpy as np
from pandas import Series

df = pd.DataFrame({'A': [1, 1, 2, 2],
                   'B': [1, 2, 2, 2],
                   'C': np.random.randn(4),
                   'D': ['one', 'two', 'three', 'four']})

def aggregate(x):
    return Series(dict(C=round(x['C'].mean()), D=' '.join(x['D'])))

print(df.groupby(['A', 'B']).apply(aggregate))
       C           D
A B                 
1 1  0.0         one
  2 -1.0         two
2 2 -0.0  three four

Как получить «нормальные» ключи?Как

   C           D
0  0.0         one
1 -1.0         two
2 -0.0  three four

Ответы [ 2 ]

0 голосов
/ 25 мая 2018

Для лучшей производительности лучше использовать DataFrameGroupBy.agg от dictionary, последнее добавление reset_index с drop=True для удаления MultiIndex:

aggregate = {'C':lambda x: round(x.mean()), 'D':' '.join}
print(df.groupby(['A', 'B']).agg(aggregate).reset_index(drop=True))
     C           D
0  0.0         one
1  0.0         two
2  1.0  three four

Если хотите MultiIndex конвертировать в columns, есть 2 способа:

print(df.groupby(['A', 'B'], as_index=False).agg(aggregate))

Или:

print(df.groupby(['A', 'B']).agg(aggregate).reset_index())
   A  B    C           D
0  1  1  0.0         one
1  1  2 -1.0         two
2  2  2 -1.0  three four
0 голосов
/ 25 мая 2018

Вы можете использовать reset_index и указать необязательный параметр drop=True.Обратите внимание, что это полностью удаляет индекс ключа вашей группировки.

print(df.groupby(['A', 'B']).apply(aggregate).reset_index(drop=True))

   C           D
0  0         one
1 -1         two
2  0  three four
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...