Разделите ваши целые наборы данных на категории Обучение, Тестирование и Проверка. Поскольку у вас есть данные 1M, вы можете разделить их следующим образом: 60% обучения, 20% тестирования и 20% проверки. Разделение наборов данных полностью зависит от вас и ваших требований. Но обычно максимальные данные используются для обучения модели. Затем остальные наборы данных можно использовать для тестирования и проверки.
Поскольку у вас есть десять классов наборов данных, разбейте каждую категорию на категории Обучение, Тестирование и Проверка.
Пусть у вас есть данные категорий A, B, C и D. Разделите ваши данные «A», «B», «C» и «D», как показано ниже:
«А» - 60% на обучение, 20% тестирование и 20% подтверждение
'B' - 60% на обучение, 20% тестирование и 20% подтверждение
'C' - 60% на обучение, 20% тестирование и 20% подтверждение
'D'- 60% на обучение, 20% тестирование и 20% подтверждение
Наконец, объедините все наборы данных A, B, C и D для обучения, тестирования и проверки.