Что ж, одно из решений - это проанализировать дамп Wikipedia XML.
Просто подумал, что я это опубликую.
Если вы получаете только один страница, это излишне.Но если вам не нужна самая свежая информация, то преимуществом использования XML будет возможность однократной загрузки вместо повторных сетевых обращений.