Value_counts в нескольких столбцах с groupby - PullRequest
0 голосов
/ 24 августа 2018

Мне нужна помощь с пандами.

У меня есть следующий фрейм данных:

df = pd.DataFrame({'1Country': ['FR', 'FR', 'GER','GER','IT','IT', 'FR','GER','IT'],
               '2City': ['Paris', 'Paris', 'Berlin', 'Berlin', 'Rome', 'Rome','Paris','Berlin','Rome'],
               'F1': ['A', 'B', 'C', 'B', 'B', 'C', 'A', 'B', 'C'],
               'F2': ['B', 'C', 'A', 'A', 'B', 'C', 'A', 'B', 'C'],
               'F3': ['C', 'A', 'B', 'C', 'C', 'C', 'A', 'B', 'C']})

снимок экрана

Я пытаюсь сделать groupby в первых двух столбцах 1Country и 2City и do value_counts в столбцах F1 и F2.До сих пор я мог выполнять только групповые операции и value_counts в 1 столбце одновременно с

df.groupby(['1Country','2City'])['F1'].apply(pd.Series.value_counts)

Как я могу сделать value_counts в нескольких столбцах и получить в результате рамку данных?

Ответы [ 2 ]

0 голосов
/ 24 августа 2018

Вы можете передать диктовку agg следующим образом:

df.groupby(['1Country', '2City']).agg({'F1': 'value_counts', 'F2': 'value_counts'})
0 голосов
/ 24 августа 2018

Вы можете использовать agg, что-то вроде этого:

df.groupby(['1Country','2City']).agg({i:'value_counts' for i in df.columns[2:]})

               F1   F2   F3
FR  Paris  A  2.0  1.0  2.0
           B  1.0  1.0  NaN
           C  NaN  1.0  1.0
GER Berlin A  NaN  2.0  NaN
           B  2.0  1.0  2.0
           C  1.0  NaN  1.0
IT  Rome   B  1.0  1.0  NaN
           C  2.0  2.0  3.0
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...