У меня есть два DataFrames, и в каждом из них у меня есть категорический столбец col
. Я хочу заменить все категории числами, поэтому я решил сделать это следующим образом:
df1['col'] = pd.factorize(df1['col'])[0]
Теперь вопрос заключается в том, как я могу кодировать df2[col]
таким же образом? И как я могу также кодировать категории, которые присутствуют в df2[col]
, но не в df1[col]
?