Question

У меня есть два столбца в моем фрейме данных, и оба являются категориальными.Один из этих столбцов содержит ошибки в написании, и я хочу сделать в нем обнаружение выбросов и попытаться использовать Isolation Forest.

Я применил OneHotEncoding к обоим столбцам, но я не знаю, как использовать этот массивный массив в лесу изоляции,Буду признателен за помощь.Вот мой код для OneHotEncoding

newDF=pd.DataFrame()
labelEncoder = LabelEncoder()
newDF = df.apply(labelEncoder.fit_transform)

enc = OneHotEncoder()
enc.fit(newDF)

onehotlabels = enc.transform(newDF).toarray()
print(onehotlabels)

Как использовать данные OneHotEncoded в лесу изоляции?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как использовать данные OneHotEncoded в лесу изоляции?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы