Как использовать данные OneHotEncoded в лесу изоляции? - PullRequest
0 голосов
/ 28 ноября 2018

У меня есть два столбца в моем фрейме данных, и оба являются категориальными.Один из этих столбцов содержит ошибки в написании, и я хочу сделать в нем обнаружение выбросов и попытаться использовать Isolation Forest.

Я применил OneHotEncoding к обоим столбцам, но я не знаю, как использовать этот массивный массив в лесу изоляции,Буду признателен за помощь.Вот мой код для OneHotEncoding

newDF=pd.DataFrame()
labelEncoder = LabelEncoder()
newDF = df.apply(labelEncoder.fit_transform)

enc = OneHotEncoder()
enc.fit(newDF)

onehotlabels = enc.transform(newDF).toarray()
print(onehotlabels)
...