Невозможно разобрать документ xhtml в linux - PullRequest
2 голосов
/ 09 декабря 2011

Я пытаюсь выполнить анализ хорошо сформированного документа xhtml с помощью DocumentBuilder. Требуется, чтобы я проанализировал документ xhtml и добавил содержимое к части тела документа xhtml. Для разбора документа я использую следующий код

org.w3c.dom.Document document=null; 
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
factory.setNamespaceAware(false);   
DocumentBuilder builder = factory.newDocumentBuilder();
document=builder.parse(file);

Файл - это файл xhtml, который я хочу проанализировать он отлично работает на Windows-машине, когда я пытаюсь запустить тот же код на Linux-машине, он не в состоянии проанализировать документ и дает исключение

java.net.SocketException: Unexpected end of file from server
        at sun.net.www.http.HttpClient.parseHTTPHeader(HttpClient.java:723)
        at sun.net.www.http.HttpClient.parseHTTP(HttpClient.java:589)
        at sun.net.www.http.HttpClient.parseHTTPHeader(HttpClient.java:720)
        at sun.net.www.http.HttpClient.parseHTTP(HttpClient.java:589)

Может кто-нибудь помочь мне, почему он не работает на машине Linux.

Заранее спасибо ...

1 Ответ

0 голосов
/ 09 декабря 2011

Мне приходит в голову, что парсер пытается получить схему с HTTP-сервера.Не могли бы вы попытаться отключить проверку:

factory.setValidating (false)

Или убедитесь, что вы можете правильно загрузить схемы в документе с помощью команды wget (не браузера).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...