Как я могу получить больше информации о недопустимом элементе DOM через Валидатор? - PullRequest
5 голосов
/ 10 ноября 2011

Я проверяю объект DOM в памяти, используя класс javax.xml.validation.Validator, против схемы XSD.Я получаю SAXParseException, который выдается во время проверки всякий раз, когда в информации, из которой я заполняю свой DOM, происходит повреждение данных.

Пример ошибки:

org.xml.SAXParseException: cvc-datatype-valid.1.2.1: '??? "?? [????? G?> ??? p ~ tn ?? ~ 0? 1]' не является допустимым значением val для 'hexBinary'.

Я надеюсь, что есть способ найти местоположение этой ошибки в моем DOM в памяти и распечатать неисправный элемент и его родительский элемент. Мой текущий код:

public void writeDocumentToFile(Document document) throws XMLWriteException {
  try {
    // Validate the document against the schema
    Validator validator = getSchema(xmlSchema).newValidator();
    validator.validate(new DOMSource(document));

    // Serialisation logic here.

  } catch(SAXException e) {
    throw new XMLWriteException(e); // This is being thrown
  } // Some other exceptions caught here.
}

private Schema getSchema(URL schema) throws SAXException {
  SchemaFactory schemaFactory = 
    SchemaFactory.newInstance(XMLConstants.W3C_XML_SCHEMA_NS_URI);

  // Some logic here to specify a ResourceResolver

  return schemaFactory.newSchema(schema);
}

Я изучил метод Validator#setErrorHandler(ErrorHandler handler), но интерфейс ErrorHandler дает мне только экспозицию SAXParseException, которая показывает только номер строки и номер столбца ошибки. Потому что я используюDOM в памяти возвращает -1 как для номера строки, так и для столбца.

Есть ли лучший способ сделать это? Я действительно не хочу вручную проверять строки, прежде чем добавить их вDOM, если библиотеки предоставляют мне функцию, которую я ищу.

Я использую обновление JDK 6e 26 и JDK 6 обновляют 7 в зависимости от того, где работает этот код.

РЕДАКТИРОВАТЬ: С этим добавленным кодом -

validator.setErrorHandler(new ErrorHandler() {
  @Override
  public void warning(SAXParseException exception) throws SAXException {
    printException(exception);
    throw exception;
  }

  @Override
  public void error(SAXParseException exception) throws SAXException {
    printException(exception);
    throw exception;
  }

  @Override
  public void fatalError(SAXParseException exception) throws SAXException {
    printException(exception);
    throw exception;
  }

  private void printException(SAXParseException exception) {
    System.out.println("exception.getPublicId() = " + exception.getPublicId());
    System.out.println("exception.getSystemId() = " + exception.getSystemId());
    System.out.println("exception.getColumnNumber() = " + exception.getColumnNumber());
    System.out.println("exception.getLineNumber() = " + exception.getLineNumber());
  }
});

Я получаю вывод:

exception.getPublicId() = null
exception.getSystemId() = null
exception.getColumnNumber() = -1
exception.getLineNumber() = -1

Ответы [ 2 ]

5 голосов
/ 17 ноября 2011

Если вы используете Xerces (по умолчанию Sun JDK), вы можете получить элемент, который не прошел проверку, через свойство http://apache.org/xml/properties/dom/current-element-node:

...
catch (SAXParseException e)
{
    Element curElement = (Element)validator.getProperty("http://apache.org/xml/properties/dom/current-element-node");

    System.out.println("Validation error: " + e.getMessage());
    System.out.println("Element: " + curElement);
}   

Пример:

String xml = "<root xmlns=\"http://www.myschema.org\">\n" +
             "<text>This is text</text>\n" +
             "<number>32</number>\n" +
             "<number>abc</number>\n" +
             "</root>";

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
dbf.setNamespaceAware(true);
Document doc = dbf.newDocumentBuilder().parse(new ByteArrayInputStream(xml.getBytes("UTF-8")));
Schema schema = getSchema(getClass().getResource("myschema.xsd"));

Validator validator = schema.newValidator();
try
{
    validator.validate(new DOMSource(doc));
}
catch (SAXParseException e)
{
    Element curElement = (Element)validator.getProperty("http://apache.org/xml/properties/dom/current-element-node");

    System.out.println("Validation error: " + e.getMessage());
    System.out.println(curElement.getLocalName() + ": " + curElement.getTextContent());

    //Use curElement.getParentNode() or whatever you need here
}         

Если вам нужно получить номера строк / столбцов из DOM, этот ответ имеет решение этой проблемы.

0 голосов
/ 16 ноября 2011

SaxParseException предоставляет SystemId и PublicId. Разве это не дает вам достаточно информации?

...