Какая методология лежит в основе поиска k наиболее важных статей с использованием библиотеки Wikipedia Python? - PullRequest
0 голосов
/ 04 мая 2018

Получает ли библиотека Python из Википедии автоматическое получение наиболее релевантных k документов на основе заданного запроса? Какова основная структура получения этих документов? Использует ли он TF-IDF или любой другой подход?

1 Ответ

0 голосов
/ 09 мая 2018

Как видно из исходного кода модуля , wikipedia запрашивает API-интерфейс Wikipedia и возвращает его результаты. Порядок возврата документов, таким образом, определяется собственной CirrusSearch Википедии, которая основана на Elasticsearch. Вы можете найти более подробную информацию в документации по Википедии API .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...