XGBoost против Scikit-Learn - PullRequest
0 голосов
/ 08 июля 2019

Сейчас я изучаю sklearn и уже немного разбираюсь с этим. И сегодня я узнаю, что xgboost существует! Согласно различным статьям в Интернете, все просто говорят, что xgboost:

  • быстрее
  • дает лучшие результаты
  • и вообще ведет на Kaggle на всех фронтах ...

Посмотрев несколько примеров кода и прочитав официальную документацию по xgboost, я увидел, что он может использоваться как оболочка sklearn и независимо (у него есть свои собственные классы и методы обучения, прогнозирования, проверки и других необходимых вещей) .

А теперь пришло время задать вопрос: sklearn - уже в прошлом или у него есть то, чего нет у xgboost? И зачем вообще оборачиваться, если xgboost может делать все сам? Я слишком слаб в этом, но понимание того, как все устроено, и отказ от изучения устаревших библиотек очень важны!

1 Ответ

0 голосов
/ 08 июля 2019

SKLearn по-прежнему активно используется и не уходит в прошлое. Зачем вам что-то оборачивать в классы SKLearn? Потому что у SKLearn хорошая инфраструктура трубопроводов. Если вы используете XGBoost или Keras в качестве поставщика модели, вам нужно обернуть его в класс, производный от подходящей базы SKLearn , чтобы вы могли вставить его в свой конвейер.

Keras Wrappers

Упаковщики XGBoost

...