У меня есть некоторые сгруппированные данные, в которые я хотел бы удалить некоторые группы, если число строк в этой группе меньше трех. Данные выглядят так:
ID,year,age
810006862,2000,49
810006862,2001,
810006862,2002,
810006862,2003,52
810023112,2003,27
810023112,2004,28
810023112,2005,29
810023112,2006,30
810033622,2000,24
810033622,2001,25
Я пробовал этот код:
df = pd.read_csv('sample.csv')
groups = df.groupby(by=['ID'])
print(groups.apply(lambda g: g[2 < g['age'].cumcount()]))
Но я получаю сообщение об ошибке:
AttributeError: 'Series' object has no attribute 'cumcount'
Кто-нибудь может помочь? Заранее спасибо. Ожидаемый результат будет отбрасывать последнюю группу, как показано ниже:
ID,year,age
810006862,2000,49
810006862,2001,
810006862,2002,
810006862,2003,52
810023112,2003,27
810023112,2004,28
810023112,2005,29
810023112,2006,30