Мне нужно ранжировать некоторые документы на основе каждого запроса, используя три алгоритма, а именно LambdaMart, AdaRank и Coordinate Ascent. Ранее я применил методы кластеризации в Vector Space Model, используя R studio, и это было легко. Однако в этом случае (python и Learnning to Rank) я не знаю, как изменить данные в соответствии с этими алгоритмами. Поскольку у меня есть эти текстовые данные (документ и запросы) в формате TXT в отдельных файлах. Я искал решения онлайн и не могу найти правильное решение. Итак, мои вопросы в основном таковы:
1: библиотека python для вышеупомянутых алгоритмов ранжирования.
2: Преобразование данных в приемлемый формат для алгоритма LTR.
3: мне нужно использовать NLTK и снова создать VSM в python?
VSM, который я уже сгенерировал в R
Формат данных, который я хочу для LTR