Я знаю libxml через PHP, поэтому я не уверен, что это работает для вас: используйте loadHTMLFile вместо load. Таким образом, даже поврежденный файл может быть загружен, если он не более поврежден, чем обычные веб-сайты; -)
После загрузки вы можете обрабатывать его как любой обычный XML. Если вы сохраните его, файл будет восстановлен.
Если это не работает, файл имеет серьезные повреждения. Тогда нет доступа к файлу с помощью libxml.