У меня есть этот код:
# example of making multiple probability predictions
from sklearn.linear_model import LogisticRegression
from sklearn.datasets.samples_generator import make_blobs
from sklearn import preprocessing
import numpy as np
f = open("Football.txt", "r")
lines = f.readlines()
XX = []
YY = []
print(len(lines))
for k in range(1,len(lines)):
D = [float(lines[k].split(' ')[0]), float(lines[k].split(' ')[1]),
float(lines[k].split(' ')[3]), float(lines[k].split(' ')[4])]
p = int(float(lines[k].split(' ')[6]))
YY.append(p)
XX.append(D)
# fit final model
model = LogisticRegression()
model.fit(XX, YY)
# new instances where we do not know the answer
Xnew = [[0.4, -0.29, 0, -0.41],
[0, -0.41, 0.4, -0.29]]
# make a prediction
ynew = model.predict_proba(Xnew)
# show the inputs and predicted probabilities
for i in range(len(Xnew)):
print("X=%s, Predicted=%s" % (Xnew[i], ynew[i]))
В YY у меня есть только информация о том, выиграла ли команда, сыграла вничью, проиграла.Теперь я хочу добавить информацию о счете между командами.Могу ли я использовать функцию предиката_проба или что-то еще?