Путь Адриана Родригеса неплох, но, к сожалению, он будет работать только в том случае, если HTML является XHTML (то есть правильно отформатированным XML). Вы можете использовать библиотеку под названием Web Harvest (доступную на sourceforge.net) для очистки страницы и декларативного извлечения таблицы вместо написания кода для этого. Он также включает фазы в скрипте сборки для очистки страницы по мере необходимости. Я настоятельно рекомендую использовать это, так как это будет гораздо более надежное решение для ваших задач, особенно если в будущем вам понадобится очистить другие страницы.