У меня есть два столбца в моем фрейме данных, и оба являются категориальными.Один из этих столбцов содержит ошибки в написании, и я хочу сделать в нем обнаружение выбросов и попытаться использовать Isolation Forest.
Я применил OneHotEncoding к обоим столбцам, но я не знаю, как использовать этот массивный массив в лесу изоляции,Буду признателен за помощь.Вот мой код для OneHotEncoding
newDF=pd.DataFrame()
labelEncoder = LabelEncoder()
newDF = df.apply(labelEncoder.fit_transform)
enc = OneHotEncoder()
enc.fit(newDF)
onehotlabels = enc.transform(newDF).toarray()
print(onehotlabels)