Как оценить модель LinearSVR с вводом числовых и категориальных значений? - PullRequest
0 голосов
/ 21 марта 2020

В настоящее время я работаю над данными о продажах Bigmart. Вот часть набора данных, в которой мы имеем

Входные данные [Item_Visibility Item_MRP Item_Fat_Content Item_Type]

Выходные данные [Item Weight]

Здесь это пример данных:

    Item_Visibility     Item_MRP    Item_Fat_Content    Item_Type       |   Item_Weight
    0.033627            156.1314      Regular             Meat          |   9.300
    0.058682            170.4422      Regular             Baking Goods  |   11.650
    0.000000            169.3790      Low Fat             Household     |    5.820
    0.123116            95.6436       Regular             Snack Foods   |    6.305
    0.056754            247.5118      Low Fat             Baking        |   11.300

Я использовал модели ['LinearSVR' , 'Lasso' , 'Linear Regressionn' , 'BayesianRidge']

p / s: действительно не знаю, какая модель является наиболее подходящей, поэтому я просто попробую ее и проверь, какая модель самый быстрый и имеет высочайшую точность. Также был бы признателен за помощь в этой части.

Мой пример кода:

train_X, val_X, train_y, val_y = train_test_split(X,y ,test_size = 0.3, random_state = 42 )
model = LinearSVR()
model.fit(train_X, train_y)
result=model.predict(val_X)

accuracy_score(val_y, result)     #from sklearn.metrics import accuracy_score

ValueError: непрерывный не поддерживается

тогда я попытался встроенная функция оценки модели

model.score(val_y.values.reshape(-1, 1), z)

Получил эту ошибку

ValueError: matmul: входной операнд 1 имеет несоответствие в его основном измерении 0, с gufun c подпись (n?, k), (k, m?) -> (n?, m?) (размер 4 отличается от 1)

...