Я пытаюсь использовать линейную регрессию для прогнозирования целевой переменной с именем SalePrice
. У меня есть набор данных из 60+ атрибутов, исключая Id
и SalePrice
.
Это мой код. Есть ли способ это исправить?
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
label=df_data['SalePrice']
features=df_data
features.drop(columns=['SalePrice'],inplace=True)
X_train,X_test,y_train,y_test=train_test_split(features,label,test_size=0.30)
Я столкнулся с ошибкой «Значение» в «MsZoning» во время подгонки модели.
clf=LinearRegression()
clf.fit(X_train,y_train)
ValueError: не удалось преобразовать строку в число с плавающей точкой: 'RM'
MSZoning значения: array(['RL', 'RM', 'C (all)', 'FV', 'RH'], dtype=object)