Преобразование модели XGBosst для плагина Apache Solr Learning to Rank - PullRequest
0 голосов
/ 17 апреля 2019

Я хотел бы использовать модель парного ранжирования, обученную на XGBoost * в Apache Solr. Я полагаю, что модель XGBoost должна обрабатываться классом MultipleAdditiveTreesModel из плагина Solr LTR.

Однако при отображении вывода XGBoost в JSON, ожидаемый плагином Solr LTR, неясно, как обрабатывать условие отсутствует . Поскольку XGBoost имеет нетривиальную логику для маршрутизации пропущенных значений, они не всегда могут быть просто отправлены в левую или правую ветвь дерева.

Как решить эту проблему? Есть ли в XGBoost опция, обеспечивающая, чтобы пропущенные значения всегда направлялись в одну и ту же ветку или лучше, есть ли опция в плагине Solr LTR для обработки случая пропущенных значений?

* цель: «ранг: попарно»

1 Ответ

0 голосов
/ 08 мая 2019

В качестве обходного пути все отсутствующие данные можно удалить из обучающих данных, а условие «отсутствующие» можно просто пропустить при преобразовании модели для Solr. Тем не менее, это имеет недостаток в том, что вы теряете вычислительные ресурсы и ресурсы памяти, а возможно, и часть производительности XGBoosts.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...