скажем, у меня есть категориальный столбец в DataFrame (например, будний день). И я хочу закодировать его в горячую кодировку. Для этого я использую pandas.get_dummies()
. Но я не вижу способа сделать заказ детерминированным c. Например, у меня есть эти два фрейма данных
df1 = pd.DataFrame({'visitors':[220, 240, 180, 210, 220, 260, 270], 'weekday': ['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun']})
df2 = pd.DataFrame({'visitors':[240, 180, 210, 220, 260, 270, 220], 'weekday': ['Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun', 'Mon']})
И если я вызываю get_dummies()
на обоих, я получаю две разные кодировки. Я это вижу, потому что порядок другой. Но есть ли способ сделать так, чтобы любой DataFrame имел одинаковую кодировку, независимо от того, как вводятся значения? Так, например: Mon=1000000
, Tue=0100000
, et c?
pd.get_dummies(df1['weekday'])
pd.get_dummies(df2['weekday'])