GLM разделяет данные между поездом и тестом 70 30 соответственно - PullRequest
0 голосов
/ 30 января 2020

разделение данных в R train_data имеет строки 891 test_data содержит строки 418. Я хотел бы разделить данные на 70% для train_data и 30% для test_data, чтобы получить glm модель. Вот как я это делаю

split_testD <- sample(2, nrow(test_data), replace = TRUE, prob = c(0.7,0.3))
split_trainD <- sample(2, nrow(train_data), replace = TRUE, prob = c(0.7,0.3))

Но по какой-то причине, когда я пытаюсь получить модель glm, у меня получается меньше строк для test_data, что неправильно

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...