Как передать тестовые данные для получения прогнозов модели, если один обучающий кодер применен к данным обучения - PullRequest
0 голосов
/ 22 марта 2019

Я использую Sklearn.preprocessing для предварительной обработки (onehotencoder) категориальных данных.

onehotencoder = OneHotEncoder()
pre_loc_data1 = onehotencoder.fit_transform(pre_loc_data1.astype(str)).toarray()
print(pre_loc_data1)

X_train, X_test, y_train, y_test = train_test_split(pre_loc_data1, pre_loc_target, test_size=0.2)

здесь X-train теперь закодирован данными.если я даю данные y_train для модели для прогнозирования, это работает нормально.потому что это также закодированные данные.но я хочу использовать отдельную запись в качестве входных данных для модели, чтобы предсказать без кодирования, как показано ниже

(clf.predict(['Hyderabad / Secunderabad','0 Year(s) 8 Month(s)','android','java']))

, как дать такой тип данных, как ввод для модели для тестирования.

Заранее спасибо!

1 Ответ

1 голос
/ 22 марта 2019

Вам необходимо применить onehotencoder к входу (при условии, что clf ваша обученная модель):

clf.predict(onehotencoder.transform([['Hyderabad / Secunderabad','0 Year(s) 8 Month(s)','android','java']]))
...