Значение счетчика предоставляет достаточно информации для этого.
c=Df['Education_Degree'].value_counts()
Возвращает объект Series .И мы можем использовать это для создания манекенов.Или мы можем использовать другой способ получения значения счетчика:
c=Df.groupby('Education_Degree', sort=False)['Education_Degree'].count().sort_values(ascending=False)
Результат будет таким же.
Как только мы получим объект серии, мы сможем создать макеты.Но есть и другое решение.Вместо этого получаем столбцы, которые мы хотели бы сохранить:
c=c[c>995]
Мы можем получить столбцы, которые нам не нравятся.
c=c[c<=995]
c_remove = c.index.tolist() # list of columns not to keep
Таким образом, мы даже не вызываем get_dummies()
, все, что мы используем, это:
for i in range(0, len(Df)):
c=Df.loc[i,'Education_Degree']
Df.loc[i, c]=1
И, наконец, мы удалим столбцы:
Df.drop(c_remove, axis=1)