Я использую Sklearn.preprocessing для предварительной обработки (onehotencoder) категориальных данных.
onehotencoder = OneHotEncoder()
pre_loc_data1 = onehotencoder.fit_transform(pre_loc_data1.astype(str)).toarray()
print(pre_loc_data1)
X_train, X_test, y_train, y_test = train_test_split(pre_loc_data1, pre_loc_target, test_size=0.2)
здесь X-train теперь закодирован данными.если я даю данные y_train для модели для прогнозирования, это работает нормально.потому что это также закодированные данные.но я хочу использовать отдельную запись в качестве входных данных для модели, чтобы предсказать без кодирования, как показано ниже
(clf.predict(['Hyderabad / Secunderabad','0 Year(s) 8 Month(s)','android','java']))
, как дать такой тип данных, как ввод для модели для тестирования.
Заранее спасибо!