Как кодировать функцию, которая содержит список категориальных значений в каждой строке для обучения модели машинного обучения? - PullRequest
0 голосов
/ 11 июля 2019

У меня есть набор данных, в котором у меня есть список категориальных значений в качестве значения функции. Как я могу закодировать это для обучения модели?

Например, у меня есть некоторые данные, такие как:

feature1: [a, b, c]
feature2: [[category1, category2, category3], [category2], [category3, category4]]

как кодировать feature2?

1 Ответ

0 голосов
/ 11 июля 2019

Вы можете использовать LabelEncoder И OneHotEncode: -

from sklearn.preprocessing import LabelEncoder,OneHotEncoder
labelencoder_x=LabelEncoder()
X[:, 0]=labelencoder_x.fit_transform(X[:,0])   
onehotencoder_x=OneHotEncoder(categorical_features=[0]) 
X=onehotencoder_x.fit_transform(X).toarray()

Я думаю, из этого вы можете получить идею.

...