Я использую Wikipedia-api , чтобы извлечь весь текст со страниц данной категории википедии.
Как указано в руководстве -
def print_categorymembers(categorymembers, level=0, max_level=2):
for c in categorymembers.values():
print("%s: %s (ns: %d)" % ("*" * (level + 1), c.title, c.ns))
if c.ns == wikipediaapi.Namespace.CATEGORY and level <= max_level:
print_categorymembers(c.categorymembers, level + 1)
cat = wiki_wiki.page("Category:Physics")
print("Category members: Category:Physics")
print_categorymembers(cat.categorymembers
но я не могу построить логику, как это сделать, этот код просто дает мне все страницы и некоторые страницы, которые также вложены в другие страницы.
Как это сделать?