ValueError: не удалось преобразовать строку в число с плавающей точкой: 'RM' - PullRequest
0 голосов
/ 02 июля 2019

Я пытаюсь использовать линейную регрессию для прогнозирования целевой переменной с именем SalePrice. У меня есть набор данных из 60+ атрибутов, исключая Id и SalePrice.

Это мой код. Есть ли способ это исправить?

from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
label=df_data['SalePrice']
features=df_data
features.drop(columns=['SalePrice'],inplace=True)

X_train,X_test,y_train,y_test=train_test_split(features,label,test_size=0.30)

Я столкнулся с ошибкой «Значение» в «MsZoning» во время подгонки модели.

clf=LinearRegression()
clf.fit(X_train,y_train)

ValueError: не удалось преобразовать строку в число с плавающей точкой: 'RM'

MSZoning значения: array(['RL', 'RM', 'C (all)', 'FV', 'RH'], dtype=object)

...