Преобразовать VSM, сгенерированный в R, в Обучение для ранжирования формата данных - PullRequest
0 голосов
/ 27 июня 2019

Мне нужно ранжировать некоторые документы на основе каждого запроса, используя три алгоритма, а именно LambdaMart, AdaRank и Coordinate Ascent. Ранее я применил методы кластеризации в Vector Space Model, используя R studio, и это было легко. Однако в этом случае (python и Learnning to Rank) я не знаю, как изменить данные в соответствии с этими алгоритмами. Поскольку у меня есть эти текстовые данные (документ и запросы) в формате TXT в отдельных файлах. Я искал решения онлайн и не могу найти правильное решение. Итак, мои вопросы в основном таковы:

1: библиотека python для вышеупомянутых алгоритмов ранжирования. 2: Преобразование данных в приемлемый формат для алгоритма LTR. 3: мне нужно использовать NLTK и снова создать VSM в python?

VSM, который я уже сгенерировал в R

enter image description here

Формат данных, который я хочу для LTR

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...