В настоящее время я работаю над данными о продажах Bigmart. Вот часть набора данных, в которой мы имеем
Входные данные [Item_Visibility Item_MRP Item_Fat_Content Item_Type]
Выходные данные [Item Weight]
Здесь это пример данных:
Item_Visibility Item_MRP Item_Fat_Content Item_Type | Item_Weight
0.033627 156.1314 Regular Meat | 9.300
0.058682 170.4422 Regular Baking Goods | 11.650
0.000000 169.3790 Low Fat Household | 5.820
0.123116 95.6436 Regular Snack Foods | 6.305
0.056754 247.5118 Low Fat Baking | 11.300
Я использовал модели ['LinearSVR' , 'Lasso' , 'Linear Regressionn' , 'BayesianRidge']
p / s: действительно не знаю, какая модель является наиболее подходящей, поэтому я просто попробую ее и проверь, какая модель самый быстрый и имеет высочайшую точность. Также был бы признателен за помощь в этой части.
Мой пример кода:
train_X, val_X, train_y, val_y = train_test_split(X,y ,test_size = 0.3, random_state = 42 )
model = LinearSVR()
model.fit(train_X, train_y)
result=model.predict(val_X)
accuracy_score(val_y, result) #from sklearn.metrics import accuracy_score
ValueError: непрерывный не поддерживается
тогда я попытался встроенная функция оценки модели
model.score(val_y.values.reshape(-1, 1), z)
Получил эту ошибку
ValueError: matmul: входной операнд 1 имеет несоответствие в его основном измерении 0, с gufun c подпись (n?, k), (k, m?) -> (n?, m?) (размер 4 отличается от 1)