Если я правильно понимаю вас, вы ищете общее количество значений, повторяемых для каждого элемента в столбце.
Пример dataFrame:
>>> df
Category
0 Furniture
1 Technology
2 Office Supply
3 Furniture
4 Technology
5 Office Supply
6 Furniture
7 Technology
8 Office Supply
Согласно обновленному кодуshoule woek, NaN
..
>>> df['Category_Filter'] = df[df['Category'].isin(['Furniture', 'Technology'])]
>>> df
Category Category_Filter
0 Furniture Furniture
1 Technology Technology
2 Office Supply NaN
3 Furniture Furniture
4 Technology Technology
5 Office Supply NaN
6 Furniture Furniture
7 Technology Technology
8 Office Supply NaN
будет сообщаться только о тех значениях, которые вам не соответствуют. Или, если вы хотите, чтобы все строки отбрасывались со значениями NaN
, просто попробуйте:
>>> df.dropna()
# df.dropna(inplace=True) # make in permanent to the DataFrame
Category Category_Filter
0 Furniture Furniture
1 Technology Technology
3 Furniture Furniture
4 Technology Technology
6 Furniture Furniture
7 Technology Technology