Я использую sklearn для проекта машинного обучения, и один из столбцов представлен в категориальной форме. Я хотел бы преобразовать его в числовую форму с помощью порядкового кодировщика, а затем вложить недостающие данные. OrdinalEncoder от Sklearn выдает ошибку:
ValueError: Input contains NaN
, но я бы действительно не хотел сначала использовать категориальный импутер, а затем преобразовывать значения в числа, потому что он гораздо меньше подходит для характера данных. Есть ли способ обойти это?
вот код:
from sklearn.preprocessing import OrdinalEncoder
ordinalenc = OrdinalEncoder()
imd = ordinalenc.fit_transform(info[["imd_band"]])
print(ordinalenc.categories_)