Как загрузить контент wikipedia.page ()., Когда заголовок страницы содержит круглые скобки - PullRequest
1 голос
/ 22 сентября 2019

Я хотел бы загрузить содержание ряда связанных страниц для анализа ключевых слов.Но когда заголовок страницы содержит скобки, он удаляет скобки и впоследствии выдает ошибку.Как бы я мог загрузить содержимое страниц, которые содержат скобки в заголовке страницы?например, https://en.wikipedia.org/wiki/Oil_pump_(internal_combustion_engine)

import wikipedia

automotivedata = wikipedia.page("Oil_pump_(internal_combustion_engine)").content

PageError: Идентификатор страницы "oil_pump_ двигатель внутреннего сгорания" не соответствует ни одной странице.Попробуйте другой идентификатор!

1 Ответ

1 голос
/ 23 сентября 2019

Просто игнорируйте скобки.Примерно так:

print(wikipedia.page("Oil_pump_internal_combustion_engine").content)

23 сентября 2019: проблема открыта на GitHub (https://github.com/goldsmith/Wikipedia/issues/214)

...