Получение идентификатора вики-страницы по ссылке - PullRequest
0 голосов
/ 25 мая 2020

Я использовал библиотеку Википедии для python.

https://pypi.org/project/wikipedia/

https://wikipedia.readthedocs.io/en/latest/code.html#api

У меня есть список ссылок на wikipidea (например, https://en.wikipedia.org/wiki/Swell_ (ocean) ), и мне нужно получить идентификаторы wikipedia, чтобы получить содержимое страниц с:

wikipedia.page('id').content

Какие-нибудь советы?

Спасибо!

1 Ответ

0 голосов
/ 25 мая 2020

Можно попробовать так:

import wikipedia
link = "https://en.wikipedia.org/wiki/Swell_(ocean)"                                                                                           

title = link.split("/wiki/")                                                                                                                  
page = wikipedia.page(title)                                                                                                                  
page.pageid                                                                                                                                   
'2663672'
...