Итак, у меня есть этот набор данных (столбец 1000 на 1000 строк), который имеет два класса, ноль или один, где я применил приведенный ниже код, и он дал мне прогнозируемый уровень 58%. Я хочу настроить его, но я действительно запуталсямежду различными классами и как выбирать их параметры с этим типом данных, поэтому я хотел бы получить некоторые указания здесь.
#here I am importing the libraries that I need for this situation
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import svm
#reading the data
data = pd.read_csv('train.csv')
x = data.loc[:, 'D_0':'D_1023']
y = data['Class']
test = pd.read_csv('test.csv')
model = svm.SVC(kernel='linear', C=1)
model.fit(x,y)
model.score(x,y)
predictions = model.predict(test)
pd.DataFrame(predictions,
columns=['PredictedScore']).to_csv('prediction.csv')
Образец набора данных