Как закодировать столбец, содержащий (скажем, более 200) категориальное значение в машинном обучении? - PullRequest
0 голосов
/ 07 августа 2020

Я хочу закодировать столбец (скажем, Name - содержащий имена 1000 или более автомобилей). Я попробовал OneHotEncoding столбца, используя код:

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct= ColumnTransformer(transformers=[('encoder',OneHotEncoder(),[0,1,4,5,6])],remainder='passthrough')
x = np.array(ct.fit_transform(x))

Когда я запустил эту строку кода, она выдала 2 ошибки: 1) не удалось преобразовать строку в float: 2) Для разреженного вывода все столбцы должны быть числом c или преобразованным в число c.

Есть ли способы кодировать столбец, содержащий 1000 или более категориальных значений?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...