У меня есть код Python, в котором я использую XGBoost для прогнозирования на базе данных Pandas. Вот мой код.
feature_importance = model.predict(xgb.DMatrix(df[[i for i in
cols]],df['res'],missing=np.nan),**pred_contribs=True**)
Я пытаюсь переписать его в Spark, используя XGBoost 4j - Spark.
Но я не могу найти флаг pred_contribs
в методе преобразования или прогнозирования. Также я не могу найти отдельный метод в Spark Wrapper для XGBoost - XGBRegressor / XGBClassifier.
Я хочу запустить только метод прогнозирования, но распределенным способом.
Кто-нибудь может мне помочь с этим?
Мне удалось найти метод в классе Booster, но я не знаю, как использовать его на искровом фрейме данных, так как он ожидает DMatrix, и я не хочу создавать DMatrix на одной машине.