У меня есть следующий фрейм данных, как я могу создать новый столбец с городами, которые представляют 80% всех значений? В данном случае это «a», «b» и «c». Остальные города должны иметь метку «прочее».
values = ['a','a','a','a','a','a','a','a','b','b','b','b','b','b','c','c','c','c','c','d','d','d','e','e','f']
db = pd.DataFrame(values,columns = ['city'])
db['city'].value_counts(normalize=True)
a 0.32
b 0.24
c 0.20
d 0.12
e 0.08
f 0.04
Желаемый результат
db['city_freq'] = ['a','a','a','a','a','a','a','a','b','b','b','b','b','b','c','c','c','c','c','other','other','other','other','other','other']