Я пытаюсь написать прогнозную модель из CSV Паркинсона, которая у меня есть для тренировок.Я хочу использовать модель регрессии SVM.Я заметил, однако, что после его выполнения и попытки построить график прогнозируемого и фактического результата и попытаться увидеть, насколько они различны. Вот график, который я получаю. Почему некоторые точки наверхняя часть отсталая по сравнению с остальными и не близко к линии y=x
, которая также изображена красным.Ниже также код, который я использовал.
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sn
from sklearn.svm import SVR
import numpy as np
#Read the Data
eq = pd.read_csv("Parkinson.csv")
x = eq.iloc[:, :-1].values
y = eq.iloc[:, 9].values
y = y.reshape(-1,1)
# Feature Scaling
from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
x = sc_X.fit_transform(x)
sc_y = StandardScaler()
y = sc_y.fit_transform(y)
g1= [-2 , 3];
g2 = [-2,3];
clf = SVR(epsilon = 0.001);
y=np.ravel(y);
clf.fit(x,y);
y_pred = clf.predict(x);
plt.scatter(y_pred, y,)
plt.plot(g1,g2,'r')