У меня есть фрейм данных, который называется wine и содержит ряд строк, которые мне нужно отбросить.
Как убрать все строки в столбце "страна", которые составляют менее 1% от целого?
Вот пропорции:
#proportion of wine countries in the data set
wine.country.value_counts() / len(wine.country)
US 0.382384
France 0.153514
Italy 0.100118
Spain 0.070780
Portugal 0.062186
Chile 0.056742
Argentina 0.042835
Austria 0.034767
Germany 0.028928
Australia 0.021434
South Africa 0.010233
New Zealand 0.009069
Israel 0.006133
Greece 0.004493
Canada 0.002526
Hungary 0.001755
Romania 0.001558
...
Я стал ленивым и не включил все результаты, но я думаю, что вы поймете мой дрейф. Мне нужно отбросить все строки с пропорциями меньше 0,01
Вот заголовок моего фрейма данных:
country designation points price province taster_name variety year price_category
Portugal Avidagos 87 15.0 Douro Roger Voss Portuguese Red 2011.0 low