Точки выключены в регрессионной модели - PullRequest
0 голосов
/ 20 ноября 2018

Я пытаюсь написать прогнозную модель из CSV Паркинсона, которая у меня есть для тренировок.Я хочу использовать модель регрессии SVM.Я заметил, однако, что после его выполнения и попытки построить график прогнозируемого и фактического результата и попытаться увидеть, насколько они различны. Вот график, который я получаю. enter image description here Почему некоторые точки наверхняя часть отсталая по сравнению с остальными и не близко к линии y=x, которая также изображена красным.Ниже также код, который я использовал.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sn
from sklearn.svm import SVR
import numpy as np


#Read the Data
eq = pd.read_csv("Parkinson.csv")

x = eq.iloc[:, :-1].values
y = eq.iloc[:, 9].values
y = y.reshape(-1,1)

# Feature Scaling
from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
x = sc_X.fit_transform(x)
sc_y = StandardScaler()
y = sc_y.fit_transform(y)

g1= [-2 , 3];
g2 = [-2,3];

clf = SVR(epsilon = 0.001);
y=np.ravel(y);
clf.fit(x,y);

y_pred = clf.predict(x);

plt.scatter(y_pred, y,)
plt.plot(g1,g2,'r')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...