Как сделать прогноз из перекрестной валидации? - PullRequest
1 голос
/ 02 декабря 2019

Я работаю над созданием модели прогнозирования. Мне удалось достичь до получения результатов перекрестной проверки. Теперь я понятия не имею, как продолжить. Какую функцию я должен использовать, чтобы делать прогнозы, используя результаты перекрестной проверки?

X = data.iloc[:,0:16]
Y = data.iloc[:,16]
validation_size = 0.20
seed = 7
X_train, X_validation, Y_train, Y_validation = model_selection.train_test_split(X, Y,
test_size=validation_size, random_state=seed)
models = [
    ('LR', LogisticRegression()),
    ('CART', DecisionTreeClassifier()),
    ('KNN', KNeighborsClassifier()),
    ('SVM', SVC())
]

results, names = [], []
for name, model in models:
    seed = 32
    scoring = 'accuracy'
    kfold = model_selection.KFold(n_splits=10, random_state=seed)
    cv_results = model_selection.cross_val_score(model, X_train, Y_train, cv=kfold, scoring=scoring)
    results.append(cv_results)
    names.append(name)
    msg = "%s: %f (%f)" % (name, cv_results.mean(), cv_results.std())
    print(msg)

1 Ответ

0 голосов
/ 02 декабря 2019

Перекрестная проверка в основном используется в качестве более надежной схемы проверки, чтобы проверить, хорошо ли работает ваша модель. После этого вы можете обучать модель со всем набором данных после того, как будете удовлетворены вашим показателем перекрестной проверки, или можете использовать.

sklearn.model_selection.cross_val_predict

, который предсказывает перекрестные проверенные оценки. Вы можете проверить документацию для получения дополнительной информации.

...