Если ваша разметка действительна, вы можете проанализировать ее с помощью синтаксического анализатора XML, а не анализатора HTML.
Редактировать: Просто понял это:
<START:organization>..<END>
Здесь есть пара проблем. Во-первых, начальный и конечный теги не совпадают. Если открывающий тег - '´ then it should be terminated by
`. Во-вторых, использование двоеточия в имени узла имеет определенное значение в XML - а именно, что первая часть является пространством имен, а вторая часть - именем узла. В этом случае вам следует либо использовать тег с названием «организация», либо использовать его в атрибуте. Первое, вероятно, имело бы смысл. Итак:
<organization>..</organization>
Если вы не можете изменить это, вы не можете использовать синтаксический анализатор XML / HTML, так как он не является действительным ни XML, ни HTML.