Я хотел бы начать объяснение перекрестной проверки и разделения на поезда и тесты, которое было объяснено здесь .
Во-первых, вам нужно разделить тесты на поезда (что-то вроде следующего)
>>> X_train, X_test, y_train, y_test = train_test_split(
... X, y, test_size=0.20, random_state=42)
Затем выполнить перекрестную проверку набора обучающих данных, а также у вас есть набор тестовых данных размером 20% от исходного набора данных.,
kfolds = KFold(n_splits=10, random_state=42, shuffle=False)
for train, test in kfolds.split(X_train):
print("Train Index: ", train, "\n")
print("Test Index: ", test)