В настоящее время я использую просто:
down_sample_size = 3000
train <- train[sample(nrow(train), down_sample_size),]
, чтобы уменьшить выборку моих тренировочных данных, чтобы ускорить подбор моей модели (в контексте поиска гиперпараметров и CV - выше упрощено).Есть ли лучшие способы сделать это?Например, в контексте классификации должны учитываться априорные значения классов и стратификация.Однако, может быть, вышесказанное приемлемо для регрессии?Спасибо.