Question

В настоящее время я использую просто:

down_sample_size = 3000
train <- train[sample(nrow(train), down_sample_size),]

, чтобы уменьшить выборку моих тренировочных данных, чтобы ускорить подбор моей модели (в контексте поиска гиперпараметров и CV - выше упрощено).Есть ли лучшие способы сделать это?Например, в контексте классификации должны учитываться априорные значения классов и стратификация.Однако, может быть, вышесказанное приемлемо для регрессии?Спасибо.

K.J.J.K · Answer 1 · 12 февраля 2019

Это кажется вполне приемлемым, если у вас нет кластеров или любой другой жизнеспособной причины для неслучайной выборки.Я делал нечто подобное сотни раз для линейной регрессии.

понижающая выборка в r для регрессии (НЕ классификация)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

понижающая выборка в r для регрессии (НЕ классификация)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы