Я новичок в Python и Pandas и у меня возникли некоторые проблемы при работе с DataFrame
s.
У меня есть следующие данные, установленные в Pandas DataFrame
.
InvoiceId StockCode Price
XXX ProductA 199,00
XXX ProductB 78,00
XXX ProductC 100,00
YYY ProductB 78,00
YYY ProductA 199,00
ZZZ ProductA 199,00
ZZZ ProductB 78,00
... ... ...
ZZZ ProductY 19,00
Я хочу посчитать, как часто каждый продукт был куплен, и сохранить лучшие n продуктов в моем DataFrame
.Как я могу это сделать?
Например, для лучших n = 2 продуктов результат будет следующим:
InvoiceId StockCode Price
XXX ProductA 199,00
XXX ProductB 78,00
YYY ProductB 78,00
YYY ProductA 199,00
ZZZ ProductA 199,00
ZZZ ProductB 78,00
Т.е. строки с ProductC и ProductZ были удалены.
В конце я хочу представить данные по первым n продуктам следующим образом.
ProductA ProductB
XXX 1 1
YYY 1 1
ZZZ 1 1
Буду признателен за любую помощь.