Я хотел бы использовать перекрестную проверку в k-кратном порядке при изучении модели. Пока я делаю это так:
# splitting dataset into training and test sets
X_train, X_test, y_train, y_test = train_test_split(dataset_1, df1['label'], test_size=0.25, random_state=4222)
# learning a model
model = MultinomialNB()
model.fit(X_train, y_train)
scores = cross_val_score(model, X_train, y_train, cv=5)
На этом шаге я не совсем уверен, должен ли я использовать model.fit () или нет, потому что в официальной документации sklearn они не подходят, а просто вызывают cross_val_score следующим образом (они не даже разбить данные на обучающие и тестовые наборы):
from sklearn.model_selection import cross_val_score
clf = svm.SVC(kernel='linear', C=1)
scores = cross_val_score(clf, iris.data, iris.target, cv=5)
Я бы хотел настроить гиперпараметры модели во время изучения модели. Какой правильный трубопровод?