Будет задействован некоторый ручной труд, но это должно быть выполнимо, используя ресурсы, описанные ниже.
Моей первой мыслью было просто заняться поиском, и я наткнулся на http://www.mediawiki.org/wiki/Alternative_parsers. Кажется, что все эти парсеры берут данные и преобразуют их в XML, а не из XML, также ни один из них не основан на .NET что не может быть супер важным в долгосрочной перспективе, если не было задействовано никакого кодирования. Кто знает, что здесь может быть что-то, на что стоит обратить внимание.
Затем я нашел http://www.mediawiki.org/wiki/Manual:Importing_XML_dumps. Я полагаю, что если вы можете импортировать данные в формате XML, тогда все, что вам действительно нужно знать, - это схема, чтобы вы могли соответствующим образом переформатировать свои данные. Самое лучшее, что есть , - это то, что на этой странице есть ссылка на http://www.mediawiki.org/wiki/Manual:XML_Import_file_manipulation_in_CSharp, пример C # работы с файлами импорта Media Wiki XML Import. Учитывая пример, кажется, что это всего лишь небольшой шаг для создания классов, необходимых для создания необходимого XML с нуля и выгрузки ваших данных. Вот ссылка на официальную документацию схемы: http://www.mediawiki.org/xml/export-0.3.xsd.
В зависимости от того, хотите ли вы написать PHP или нет, появляется другая опция. Вы можете написать расширение XMLTransform, о котором говорилось здесь: http://www.ehartwell.com/TechNotes/MediaWikiXmlExtension.htm. Этот сайт, кажется, говорит, что вы можете сохранить свой XML в его собственном формате и написать собственный лист XSL для отображения содержимого в нужном формате.
Удачи!