Как улучшить производительность LightGBM Ranker? - PullRequest
0 голосов
/ 09 марта 2020

У меня есть несколько сэмплов (~ 5000) с их характеристиками, и я хочу оценить их по количеству очков. Я уже построил регрессионную модель, которая непосредственно прогнозирует оценку, но я все еще хочу попробовать методы обучения ранжированию, поэтому я обратился к рейтингу LightGBM.

Поскольку LightGBM Ranker принимает значение метки ниже 31, я нужно сгруппировать баллы по нескольким категориям, например, от 1 до 4. После обучения Ранкер может ранжировать сэмплы и получает хороший балл NDCG@20, но не может ранжировать элементы в пределах одной группы.

Моя проблема чем-то похожа на один запрос против ~ 5000 документов, кажется немного отличается от обычных проблем с ИК. Было бы идеально, если бы Ранкер принял полный порядок или фактические оценки моих образцов в качестве меток, но я не знаю, как этого добиться. В некоторых сообщениях предлагается использовать параметр label_gain, но я не могу найти никакой документации о том, как его правильно настроить.

Я новичок в моделях ранжирования, пожалуйста, помогите. Спасибо!

...