Дано:
import pandas as pd
lis1= ('apple','orange','strawberry','strawberry','strawberry','apple','orange','orange','orange','strawberry')
lis2= ("lorem ipsum review","lorem ipsum review","lorem ipsum review","lorem ipsum review","lorem ipsum review","lorem ipsum review","lorem ipsum review","lorem ipsum review","lorem ipsum review","lorem ipsum review")
pd.DataFrame({'category':lis1, 'review': lis2})
category review
0 apple lorem ipsum review
1 orange lorem ipsum review
2 strawberry lorem ipsum review
3 strawberry lorem ipsum review
4 strawberry lorem ipsum review
5 apple lorem ipsum review
6 orange lorem ipsum review
7 orange lorem ipsum review
8 orange lorem ipsum review
9 strawberry lorem ipsum review
Требуется:
lis1= ('orange','strawberry','strawberry','strawberry','orange','orange','orange','strawberry')
lis2= ("lorem ipsum review","lorem ipsum review", "lorem ipsum review","lorem ipsum review","lorem ipsum review","lorem ipsum review","lorem ipsum review","lorem ipsum review")
pd.DataFrame({'category':lis1, 'review': lis2})
category review
0 orange lorem ipsum review
1 strawberry lorem ipsum review
2 strawberry lorem ipsum review
3 strawberry lorem ipsum review
4 orange lorem ipsum review
5 orange lorem ipsum review
6 orange lorem ipsum review
7 strawberry lorem ipsum review
Мне нужен код для подсчета уникальных категорий (nunique ()) и удаления категорий, которые отображаются только меньшечем в 3 раза.Пример показывает, что, поскольку apple - единственная категория, которая появляется дважды, было применено удаление по списку.