То, что вы пытаетесь сделать, очень сложно. HTML не может быть проанализирован с использованием синтаксического анализатора XML, поскольку XML является строгим, а HTML - нет. Если бы этот HTML-код соответствовал XHTML (HTML как XML), то синтаксический анализатор XML проанализировал бы HTML без проблем.
Возможно, вы захотите узнать, есть ли конвертеры HTML в XHTML, если вы действительно хотите использовать анализатор XML для HTML.
Другими словами, я еще не встречал синтаксический анализатор XML, который обрабатывает искаженный XML ... они не предназначены для принятия разметки, как HTML (и по уважительной причине, тоже :))