Если вы готовы приложить дополнительные усилия, ответ: у вас это уже есть.
Потяните вниз отдельные страницы с этого сайта и очистите HTML. Я взглянул на источник, и он выглядит достаточно хорошо отформатированным. После этого вы можете выводить в XML или любой другой формат, который вам нужен.
Если вы чувствуете себя особенно амбициозно, вы можете использовать XSLT для прямого преобразования HTML-кода на этих страницах в нечто более полезное.