Рекомендуемое инженерное моделирование - PullRequest
0 голосов
/ 01 марта 2020

Я пишу этот код:

X3 = df.iloc[:,df.columns !='strength']
Y3 = np.array(df['strength'])
Low_Quantile = X3.quantile(0.05)
High_Quantile = X3.quantile(0.95)
LowOutliers_data = (X3< Low_Quantile)
HighOutliers_data = (X3 > High_Quantile)
X3.mask(LowOutliers_data, Low_Quantile, axis=1, inplace = True)  
X3.mask(HighOutliers_data,High_Quantile,axis =1, inplace = True)
df3_normalized = scaler.fit_transform(X3)
df3_normalized = pd.DataFrame(df3_normalized,columns = X3.columns)
xtrain,xtest,ytrain,ytest = train_test_split(df3_normalized,Y3,test_size = 0.3 , random_state=5)
lm = LinearRegression()
lm.fit(xtrain,ytrain)
y_predict_lm = lm.predict(xtest)
print(lm.score(xtrain,ytrain))
print(lm.score(xtest,ytest))

и выдает ошибку:

TypeError: Невозможно выполнить логическую настройку на месте для смешанных типов с не np. нан значение

...