Получение DOM для документа xhtml в Java - PullRequest
0 голосов
/ 11 декабря 2010

Я создаю мини-веб-браузер, который анализирует XHTML и Javascript, используя Javacc и Java, и мне нужно построить DOM.Есть ли какой-нибудь инструмент, который может помочь мне получить DOM и манипулировать его узлами, не создавая его вручную, когда мой браузер анализирует документ?

Ответы [ 2 ]

2 голосов
/ 11 декабря 2010

Попробуйте использовать JDOM или Dom4J или прочитайте этот вопрос о XML-парсерах для Java

Если вы хотите обрабатывать HTML, как в дикой природе, попробуйте использовать JTidy , который попытается восстановить плохо отформатированный HTML перед тем, как отобразить его в DOM.

0 голосов
/ 11 декабря 2010

Я не уверен, почему вы считаете, что вам нужен JavaCC для анализа XHTML-документа.Если это действительно допустимый XHTML, то это действительный XML, и это означает, что любой анализатор XML DOM сможет предоставить DOM, которым вы можете манипулировать.Почему бы просто не использовать синтаксический анализатор DOM, встроенный в Java или Xerces из Apache, JDOM или DOM4J?Написание собственного с использованием JavaCC может быть полезным упражнением для обучения, но я сомневаюсь, что это будет лучше, чем то, что у вас уже есть.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...