Создание списка всех значений, которые должны использоваться как фиктивные переменные
A, b, c, d представляют потерянный столбец в наборе данных
dummy_list=['a','b','c','d','e']
# function to create dummy variables in dataset
def dummy_df(df, dummy_list):
for df_copy in dummy_list:
dummies = pd.get_dummies(df[df_copy], prefix=df_copy, dummy_na=False,drop_first=True)
df=df.drop(df_copy, 1)
df=pd.concat([df,dummies],axis =1)
return df
df_copy= dummy_df(df_copy,dummy_list)
исходный набор данных : (2000,80)
после кодировки фиктивных переменных: (0,274)