Java: Как предотвратить 'systemId' в EntityResolver # resolEntity (String publicId, String systemId) от абсолютизации до текущего рабочего каталога - PullRequest
8 голосов
/ 30 октября 2009

Я хочу проанализировать следующий XML-документ для разрешения всех сущностей в нем:

 <!DOCTYPE doc SYSTEM 'mydoc.dtd'>
 <doc>&title;</doc>

Предполагается, что мой EntityResolver извлекает внешнюю сущность с заданным идентификатором системы из базы данных, а затем выполняет разрешение, см. Иллюстрацию ниже:

 private static class MyEntityResolver
 {
    public InputSource resolveEntity(String publicId, String systemId)
        throws SAXException, IOException
    {
        // At this point, systemId is always absolutized to the current working directory, 
        // even though the XML document specified it as relative.
        // E.g. "file:///H:/mydoc.dtd" instead of just "mydoc.dtd"
        // Why???  How can I prevent this???

        SgmlEntity entity = findEntityFromDatabase(systemId);
        InputSource is = new InputSource(new ByteArrayInputStream(entity.getContents()));
        is.setPublicId(publicId);
        is.setSystemId(systemId);
        return is;
    }
 }

Я пытался использовать DOM (DocumentBuilder) и SAX (XMLReader), установил для преобразователя сущностей MyEntityResolver (т.е. setEntityResolver(new MyEntityResolver())), но systemId в MyEntityResolver#resolveEntity(String publicId, String systemId) всегда абсолютизируется в текущем рабочем каталоге.

Я также пытался позвонить setFeature("http://xml.org/sax/features/resolve-dtd-uris", false);, но это ничего не помогало.

Так как я могу достичь того, чего хотел?

Спасибо!

Ответы [ 2 ]

8 голосов
/ 03 ноября 2009

Очевидно, есть еще один интерфейс, который называется EntityResolver2 , который является расширением старого EntityResolver . (Разговор о запутанных именах!)

В любом случае, я обнаружил, что EntityResolver2 достиг того, что хотел, то есть он не вносит никаких изменений в systemId, поэтому он всегда будет точно таким, как указано в документе XML.

0 голосов
/ 30 октября 2009

С Javadocs EntityResolver :

Если системным идентификатором является URL, SAX-парсер должен разрешить его полностью прежде чем сообщать об этом применение.

Кроме того, в org.xml.sax docs есть что сказать о функции resol-dtd-uris:

Это не относится к EntityResolver.resolveEntity (), который не используется для сообщения объявлений ...

Я думаю, что вы должны либо установить базовый URI на то, с чем вы можете жить, либо использовать публичные идентификаторы вместо системных идентификаторов.

...