понижающая выборка в r для регрессии (НЕ классификация) - PullRequest
0 голосов
/ 12 февраля 2019

В настоящее время я использую просто:

down_sample_size = 3000
train <- train[sample(nrow(train), down_sample_size),]

, чтобы уменьшить выборку моих тренировочных данных, чтобы ускорить подбор моей модели (в контексте поиска гиперпараметров и CV - выше упрощено).Есть ли лучшие способы сделать это?Например, в контексте классификации должны учитываться априорные значения классов и стратификация.Однако, может быть, вышесказанное приемлемо для регрессии?Спасибо.

1 Ответ

0 голосов
/ 12 февраля 2019

Это кажется вполне приемлемым, если у вас нет кластеров или любой другой жизнеспособной причины для неслучайной выборки.Я делал нечто подобное сотни раз для линейной регрессии.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...