Использование обучения для ранжирования текстовых документов? - PullRequest
0 голосов
/ 05 июня 2019

Мне нужна помощь в реализации Learning To Rank (LTR).Это связано с моим семестровым проектом, и я совершенно новичок в этом.Подробности следующие: я собрал около 90 документов и заполнил 10 пользовательских запросов.Теперь я должен ранжировать эти документы на основе каждого запроса, используя три алгоритма, а именно LambdaMart, AdaRank и Coordinate Ascent.Ранее я применил методы кластеризации к модели векторного пространства, но это было легко.Однако в этом случае я не знаю, как изменить данные в соответствии с этими алгоритмами.Поскольку у меня есть эти текстовые данные (документ и запросы) в формате TXT в отдельных файлах.Я искал решения в Интернете, и я не могу найти правильное решение, поэтому кто-нибудь здесь, пожалуйста, направьте меня в правильном направлении, то есть Шаги.Я был бы очень признателен.

1 Ответ

0 голосов
/ 05 июня 2019

Как вы сказали, вы применили кластеризацию в модели векторного пространства.ввод этих алгоритмов также векторы.Почему бы вам не взглянуть на стандартный набор данных, введенный для обучения ранжированию ( Летор бенчмарк ), в котором документы отображаются в векторах функций?Существует также реализация этого алгоритма, представленная в Java (RankLib), которая может дать вам идею для решения проблемы.Я надеюсь, это поможет вам!

...