Каков наилучший способ проанализировать дамп вики в формате, который содержит самостоятельно сгенерированный идентификатор статьи и содержимое статьи и ничего больше?
Идентификатор статьи будет идентификатором ссылки и содержимымобычный текст без ссылки без ссылок.