Как я могу получить невыбранные номера? - PullRequest
0 голосов
/ 20 января 2020

Я создал обучающее и тестовое подмножество из моих исходных данных:

df <- data.frame(var = seq(1, 200, by = 2))
train.rows <- sample(1:100, 75, replace = FALSE)
df.train <- df[train.rows,]
df.test <- df[-train.rows,]

Как я могу увидеть номера строк в исходном кадре данных (df), которые я выбрал, чтобы быть в df.test? (Чтобы увидеть те, которые я выбрал в df.train, я бы просто посмотрел trains.rows. Но это невозможно для -train.rows)

Редактировать: заголовок о том, что я указать / выбрать строки для тренировочного набора, и теперь я просто хочу знать те, которые я не выбрал для тренировочного набора

1 Ответ

1 голос
/ 20 января 2020

Существует несколько способов приблизиться к этому:

1) Поскольку это один столбец данных, используйте drop = FALSE

df.train <- df[train.rows,, drop = FALSE]
df.test <- df[-train.rows,, drop = FALSE]

Теперь вы можете видеть номера строк в df.train и df.test, который можно извлечь с помощью rownames(df.train) и rownames(df.test).

2) Вы можете использовать setdiff, чтобы включить индекс строк, который присутствует в df.test.

setdiff(1:nrow(df), train.rows)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...