У моего сюжета очень жирная линия, которую я не ожидал и не смог устранить самостоятельно. Я не знаю, как показать изображение.
Выполнение EDA для набора данных Craigslist Kaggle Auto. Я хочу отобразить, а затем сравнить и сопоставить соответствие линейной и полиномиальной регрессии, соотнося цену и год выпуска модели для каждой уникальной марки автомобиля и модели (например, Ford F150).
Как сделать следующий график с более нормальнымсмотря линия, ширина линии ничего не меняет.
df_f150=df[df['Make and Model']=='ford F-150']
#plotting a linear regression line for each dataframe
fig = plt.figure(figsize=(10,7))
sns.regplot(x=df_f150.year, y=df_f150.price, color='b')
'#Here is where I try to do one of the polynomial regressions'
# Legend, title and labels.
#plt.legend(labels=x)
plt.title('Relationship Between Model Year and Price', size=24)
plt.xlabel('Year', size=18)
plt.ylabel('Price', size=18)
plt.xlim(1990,2020)
plt.ylim(1000,100000)
from sklearn.preprocessing import PolynomialFeatures
X = df_f150['year'].values.reshape(-1,1)
y = df_f150['price'].values.reshape(-1,1)
poly = PolynomialFeatures(degree = 8)
poly.fit_transform(X)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
regressor = LinearRegression()
regressor.fit(X_train, y_train) #training the algorithm
#To retrieve the intercept:
print(regressor.intercept_)
#For retrieving the slope:
print(regressor.coef_)
y_pred = regressor.predict(X_test)
dfres = pd.DataFrame({'Actual': y_test.flatten(), 'Predicted': y_pred.flatten()})
dfres
plt.scatter(X_test, y_test, color='gray')
plt.plot(X_test, y_pred, color='red', linewidth=2)
plt.show()