Question

В чем различия между sklearnAPI (LGBMModel, LGBMClassifier и т. Д.) И API по умолчанию (lgb.Dataset, lgb.cv, lgb.train) из lightgbm?Какой из них мне лучше использовать?
Лучше ли использовать lgb.cv или gridsearchcv / randomisedsearchcv из sklearn при использовании lightgbm?

Sift · Answer 1 · 12 февраля 2019

Этот ответ был хорошо освещен здесь
На основании этого ноутбука Уилла Кёрсена API-интерфейс перекрестной проверки sklearn невключить опцию для ранней остановки.Поэтому, если вы хотите использовать ранние этапы остановки (что может быть очень полезно, если вы хотите прекратить тренировку, когда показатель проверки не улучшился для заданного числа оценщиков), лучше использовать перекрестную проверку LightGBM (lgb.cv)function.

Кроме того, выдержка из ответа Михаила Лисёви - "Технически, lightbgm.cv () позволяет оценивать производительность только при k-кратном разделении с фиксированными параметрами модели. Для гипернастройки параметров вам нужно будет запустить его в цикле, предоставляя различные параметры и записывая усредненную производительность для выбора наилучшего набора параметров. после завершения цикла. Этот интерфейс отличается от sklearn, который предоставляет вам полную функциональность для оптимизации гиперпараметров вЦикл CV. Лично я бы порекомендовал использовать sklearn-API lightgbm. Это просто оболочка для встроенной функциональности lightgbm.train (), поэтому он не медленнее. Но он позволяет использовать полный стек sklearn.инструментарий, который делаетваша жизнь НАМНОГО проще. "

Таким образом, какой метод вы в конечном итоге используете, зависит от контекста проблемы, а также от того, какие факторы для вас важнее - early_stopping_rounds или простота оптимизации гиперпараметра по сравнению спеременные параметры.

LightGBM - sklearnAPI против API обучения и структуры данных и lgb.cv против gridsearchcv / randomisedsearchcv

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

LightGBM - sklearnAPI против API обучения и структуры данных и lgb.cv против gridsearchcv / randomisedsearchcv

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы