Функция для вставки данных в набор данных с использованием python - PullRequest
0 голосов
/ 06 мая 2020

Я создаю программу, которая предсказывает цифры из набора данных. Я хочу, чтобы, когда он предсказывал данные, их должно быть два случая, если он предсказывает правильно, тогда данные должны автоматически добавляться в набор данных, в противном случае требуется правильный ответ от пользователя и вставка в набор данных.

код

import numpy as np
import pandas as pd
import matplotlib.pyplot as pt
from sklearn.tree import DecisionTreeClassifier
data = pd.read_csv("train.csv").values
clf = DecisionTreeClassifier()
xtrain = data[0:21000,1:]
train_label=data[0:21000,0]
clf.fit(xtrain,train_label)
xtest = data[21000: ,1:]
actual_label=data[21000:,0]
d = xtest[9]
d.shape = (28,28)
pt.imshow(d,cmap='gray')
print(clf.predict([xtest[9]]))
pt.show()

1 Ответ

0 голосов
/ 06 мая 2020

Я не уверен, что понимаю ваш вопрос, но если вы хотите различать guish между хорошими и ошибочными прогнозами и использовать разные способы, вы должны указать c сделать это.

predictions = clf.predict(xtest)
good_predictions = xtest[pd.Series(predictions == actual_label)]
bad_predictions = xtest[pd.Series(predictions != actual_label)]

Итак, в good_predictions будут все строки в xtest, которые были предсказаны правильно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...