Я хочу закодировать столбец (скажем, Name - содержащий имена 1000 или более автомобилей). Я попробовал OneHotEncoding столбца, используя код:
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct= ColumnTransformer(transformers=[('encoder',OneHotEncoder(),[0,1,4,5,6])],remainder='passthrough')
x = np.array(ct.fit_transform(x))
Когда я запустил эту строку кода, она выдала 2 ошибки: 1) не удалось преобразовать строку в float: 2) Для разреженного вывода все столбцы должны быть числом c или преобразованным в число c.
Есть ли способы кодировать столбец, содержащий 1000 или более категориальных значений?