Внутренняя структура ссылок в вики / ранжере страниц - PullRequest
1 голос
/ 17 октября 2019

Я хочу получить внутреннюю структуру ссылок и также применить ранжирование страниц к вики в формате Викимедиа. У меня очень большой дамп файла HTML, который является файлом history.xml. Это включает в себя все внутренние ссылки в [[]], но также имеет каждую пересмотренную версию всех страниц. Мне интересно, если есть способ извлечь внутреннюю структуру ссылок. Я знаю, что дампы из Википедии поставляются с этим в отдельном файле, но у меня есть только history.xml

1 Ответ

0 голосов
/ 17 октября 2019

Дамп таблицы ссылок вики (или новой вики, в которую вы импортировали дамп xml).

...