Как подсчитать количество вхождений полу-повторяющихся строк и сделать счет новым столбцом - PullRequest
1 голос
/ 10 июля 2020

У меня есть pandas фрейм данных:

df = pd.DataFrame({'A':[4, 4, 1, 5, 1, 1],
                   'B':[2, 2, 2, 5, 2, 2],
                   'C':[1, 1, 3, 5, 3, 3],
                   'D':['q', 'e', 'r', 'y', 'u',' w']})

, который выглядит как


    A   B   C   D
0   4   2   1   q
1   4   2   1   e
2   1   2   3   r
3   5   5   5   y
4   1   2   3   u
5   1   2   3   w

Я хотел бы добавить новый столбец, который является количеством повторяющихся строк, относительно только столбцов A, B и C. Это будет выглядеть как


    A   B   C   D   Count
0   4   2   1   q   2
1   4   2   1   e   2
2   1   2   3   r   3
3   5   5   5   y   1
4   1   2   3   u   3
5   1   2   3   w   3

Я предполагаю, что это будет что-то вроде df.groupby (['A', 'B', 'C']). Size (), но я не уверен как отобразить значения обратно в новый столбец «Счетчик». Спасибо!

1 Ответ

2 голосов
/ 10 июля 2020

Мы можем transform

df['Count'] = df.groupby(['A','B','C']).D.transform('count')
df['Count']
0    2
1    2
2    3
3    1
4    3
5    3
Name: Count, dtype: int64
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...