отдельные данные для прогнозирования с помощью модели линейной регрессии с несколькими категориальными признаками - PullRequest
0 голосов
/ 02 ноября 2018

Я построил модель линейной регрессии, чтобы предсказать цифры продаж для продукта, В моем случае у меня есть 5 функций, 4 из которых являются категориальными.

MONTH REGION INTERVENANT CONFIG WEIGHT SALES_NB

Я использовал OneHotEncoder

from sklearn.preprocessing import OneHotEncoder
onehotencoder = OneHotEncoder(categorical_features = [0,1,2,3])
X = onehotencoder.fit_transform(X).toarray()
X = X [:, 1:]

(поправьте меня, если я ошибаюсь)

Я хочу знать, как мне отформатировать мои данные, чтобы передать их в Предикат (). На самом деле, если я прохожу:

Xnew = np.array([[2,2,14895,614,0.1]])
ynew = regressor.predict(Xnew)

Я получил эту ошибку:

ValueError: формы (1,4) и (428,) не выровнены: 4 (dim 1)! = 428 (dim 0)

1 Ответ

0 голосов
/ 02 ноября 2018

Попробуйте кодировать новый образец с onehotencoder, прежде чем передать его предиктору:

Xnew = np.array([[2,2,14895,614,0.1]])
Xnew_encoded = onehotencoder.transform(Xnew)
ynew = regressor.predict(Xnew_encoded)
...