Просто запустите его через парсер. Это выполнит соответствующие проверки (хорошо ли это анализирует).
Если это большой документ (как указано), тогда подойдет анализатор на основе событий (например, SAX), поскольку он не будет хранить документ в памяти.
Часто полезно иметь утилиты XML для проверки такого рода вещей. Я использую XMLStarlet , который представляет собой набор инструментов командной строки для проверки / манипулирования XML.