Увеличение данных с перекрестной проверкой в ​​Python - PullRequest
0 голосов
/ 19 апреля 2020

Я пытаюсь использовать cross_val_score для проведения интенсивного теста, чтобы получить общую точность моего решения.

from sklearn.model_selection import cross_val_score
clf = svm.SVC(kernel='linear', C=1)
scores = cross_val_score(clf, X, y, cv=5)

, но мой случай немного отличается от нормальных значений X и y. Я использую увеличение данных, чтобы генерировать больше данных для обучающей части, т.е. каждый образец будет иметь 30 новых сгенерированных данных. Другими словами, x1 будет иметь 30 шаблонов, x2 будет иметь 30 выборок, и теперь перекрестная проверка будет бесполезной, если я передам реальные данные + дополненные данные, поскольку дополненные данные предназначены только для обучающей части, а не для тестирования части, так как мне нужно только использовать реальные данные для тестирования. Есть ли способ, я могу решить эту проблему? Я надеюсь, что смог передать вопрос

...