Я в замешательстве, поскольку у многих людей есть свой подход к применению перекрестной проверки. Например, некоторые применяют его ко всему набору данных, а некоторые применяют его к обучающему набору.
Мой вопрос заключается в том, является ли приведенный ниже код подходящим для осуществления перекрестной проверки и создания прогнозов из такой модели при наличии Cross проверка применяется?
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.model_selection import KFold
model= GradientBoostingClassifier(n_estimators= 10,max_depth = 10, random_state = 0)#sepcifying the model
cv = KFold(n_splits=5, shuffle=True)
from sklearn.model_selection import cross_val_predict
from sklearn.model_selection import cross_val_score
#X -the whole dataset
#y - the whole dataset but target attributes only
y_pred = cross_val_predict(model, X, y, cv=cv)
scores = cross_val_score(model, X, y, cv=cv)