создание обучающих и тестовых наборов данных вручную в python - PullRequest
0 голосов
/ 27 марта 2020

Я пытаюсь разбить набор данных на обучающие и тестовые наборы данных вручную, что означает, что я не хочу использовать пакет обучения scikit. Я хочу разделить их таким образом, чтобы, если модуль 4 индекса строки равнялся нулю, поместил их в набор обучающих данных, иначе поместил бы их в набор тестовых данных. Я сделал это в R следующим образом:

testidx = which(1:nrow(price_accommodates_bedrooms )%%4 == 0)
df_train = price_accommodates_bedrooms [-testidx, ]
df_test = price_accommodates_bedrooms[testidx, ]

Но я не уверен, как это сделать в python, потому что я новичок в python. Заранее спасибо

1 Ответ

0 голосов
/ 27 марта 2020

Если вы хотите сделать это, вы можете воспользоваться индексом DataFrame и маскированием:

test_df = df[df.index % 4 != 0]
train_df = df[df.index % 4 == 0]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...