Если HTML является правильно сформированным XML, вы можете использовать любой метод анализа Groovy XML. На практике вы, вероятно, не сможете этого гарантировать, поэтому лучше использовать HTML-парсер. В прошлом я использовал HTML-парсер Jericho (библиотека Java) и был очень доволен результатами.