Какие основные предположения лежат в основе оценки релевантности и функции стоимости в парном обучении ранжированию? - PullRequest
0 голосов
/ 18 октября 2018

Итак, у меня есть три вопроса о парном обучении рангу.

1- Предполагается ли, что показатель релевантности, связанный с элементами, подлежащими ранжированию, является дискретным значением?

2- Существует ли эмпирическое правило о том, сколько учебных образцов вам нужно для k классов релевантности?Например, если у моих предметов есть соответствующий показатель релевантности в диапазоне от 1 до 10, сколько образцов мне нужно для обучения модели?

3- Существует ли существующий алгоритм, согласно которому потерянные функции штрафуются за все элементы в рейтинге аналогичным образом?(не наказывать за несоответствие в топе больше, чем в других)

1 Ответ

0 голосов
/ 19 ноября 2018

Полагаю, я могу ответить на первый вопрос.Одна вещь, которую я узнал, это то, что действительно важно, как алгоритм ранжирования использует оценки релевантности для обучения модели.Если базовая модель пытается выполнить регрессионную задачу, то с непрерывными значениями должно быть все в порядке.Однако, если базовая модель выполняет упорядоченную задачу классификации, тогда значения должны быть оценками и, следовательно, дискретными.Вы всегда можете попытаться дискретизировать свои непрерывные значения, однако, дискретизация оценок релевантности является хорошим решением или не зависит от рассматриваемой проблемы.

...