Как настроить мой прогноз с помощью набора двоичных данных с помощью машины опорных векторов? - PullRequest
0 голосов
/ 25 мая 2018

Итак, у меня есть этот набор данных (столбец 1000 на 1000 строк), который имеет два класса, ноль или один, где я применил приведенный ниже код, и он дал мне прогнозируемый уровень 58%. Я хочу настроить его, но я действительно запуталсямежду различными классами и как выбирать их параметры с этим типом данных, поэтому я хотел бы получить некоторые указания здесь.

#here I am importing the libraries that I need for this situation
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import svm

#reading the data
data = pd.read_csv('train.csv')
x = data.loc[:, 'D_0':'D_1023']
y = data['Class']
test = pd.read_csv('test.csv')
model = svm.SVC(kernel='linear', C=1)
model.fit(x,y)
model.score(x,y)
predictions = model.predict(test)
pd.DataFrame(predictions,
             columns=['PredictedScore']).to_csv('prediction.csv')

Образец набора данных

1 Ответ

0 голосов
/ 25 мая 2018

Параметры действительно зависят от данных, поэтому нет общих указаний.Однако, по крайней мере, попробовать ядро ​​"rbf" стоит усилий, я думаю.Кроме того, я бы сначала начал с изменения параметра C, так как это обычно имеет наибольший эффект.Но опять же, это сильно зависит от данных.

...