Я пытаюсь очистить вики-поездки от конкретных данных. как климат, получаю и т.д.
Мне удалось получить xml от них со специальным экспортом.
http://wikitravel.org/en/Special:Export/San_Francisco
Я получил данные в форме xml, но они в разметке вики, и я попытался найти решение, чтобы получить этот текст, но не смог найти подходящего решения.
Я пытался написать функцию php с регулярными выражениями, чтобы я мог преобразовать ее в html, но она конвертируется неравномерно, поэтому очень сложно выбрать конкретные данные.
Также попытался написать URL-адрес MediaWiki, чтобы я мог что-то запрограммировать
http://wikitravel.org/en/api.php?format=xml&action=query&titles=Main%20Page&prop=revisions&rvprop=content
Но это не работает.
Не могли бы вы помочь мне с этим. Кто-нибудь успешно соскобил википедию. У меня есть учебник или любая другая техника, на которую я могу ссылаться.