Модель XGBoost в Spark -> Обработка недостающих значений - PullRequest
1 голос
/ 15 октября 2019

В отличие от python, где пропущенное значение обрабатывается внутри алгоритмом XGBoost, при построении модели XGBoost в SPARK пропущенные значения неявно преобразуются в 0.0 (float ?!). Это нормально ? Существуют реальные значения, которые могут быть 0,0. Как мы можем быть уверены, что это не влияет на возможности предсказания модели?

...