Question

У меня проблема с классификацией, когда у меня есть огромный НАБОР ДАННЫХ, содержащий 308 500 данных. Я хочу разделить эти данные на набор поездов и набор тестов, чтобы создать модель.

Но я хочу, чтобы данные поезда брали, например, выборку для DATASET каждые ряды, например, каждые 1.000 rows, поэтому я знаю, что набор поездов будет построен из строк из всех DATASET. Есть ли способ сделать это?

Например, мне нужно что-то вроде этого:

train = DATASET[take sample every 1000 rows]

Ronak Shah · Answer 1 · 07 мая 2020

Вы можете использовать seq для создания индексов строк для подмножества.

train_inds <- seq(1, nrow(DATASET), 1000)
train <- DATASET[train_inds, ]
test <- DATASET[-train_inds, ]

Как разделить данные на набор поездов (и набор тестов) каждую строчку в R?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как разделить данные на набор поездов (и набор тестов) каждую строчку в R?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы