У меня проблема с классификацией, когда у меня есть огромный НАБОР ДАННЫХ, содержащий 308 500 данных. Я хочу разделить эти данные на набор поездов и набор тестов, чтобы создать модель.
Но я хочу, чтобы данные поезда брали, например, выборку для DATASET каждые ряды, например, каждые 1.000 rows, поэтому я знаю, что набор поездов будет построен из строк из всех DATASET. Есть ли способ сделать это?
Например, мне нужно что-то вроде этого:
train = DATASET[take sample every 1000 rows]