У меня есть DataFrame, подобный этому:
df = pd.DataFrame({'id':['pt1','px1','t95','sx1','dc4', 'px5'],
'feature':['f7','f7', 'f7','f8','f8', 's1'],
'score':['2','3.3','4','8','4.9', '6']})
Я хочу:
1 - вычислить размер группы для каждой группы в столбце "feature"
(результат будет f7: 3;f8: 2; s1: 1)
2 - найти максимальный размер группы (который равен f7: 3)
3 - сохранить строки, принадлежащие группе с максимальным размером (f7), и удалить оставшуюся частьстроки
Окончательный pd.DataFrame будет:
id feature score
pt1 f7 2
px1 f7 3.3
t95 f7 4
Спасибо,