Question

Я использовал XPath для разбора данных rss xml, а данные

<rss version="2.0">
  <channel>
    <title>
      <![CDATA[sports news]]>
    </title>
  </channel>
</rss>

Я хочу получить текст "спортивные новости", используя xpath "/ rss / channel / title / text ()", но результат не тот, который я хочу, реальный результат - "\ r \ n", так как чтобы найти результат, который я хочу.

код ниже:

    Document doc = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(is);
    XPathFactory xpathFactory = XPathFactory.newInstance();
    XPath xPath = xpathFactory.newXPath();
    Node node = (Node) xPath.evaluate("/rss/channel/title/text()", doc,XPathConstants.NODE);
    String title = node.getNodeValue();

prunge · Answer 1 · 08 ноября 2011

Попробуйте вызвать setCoalescing (true) на вашем DocumentBuilderFactory, и это сведет все CDATA / текстовые узлы в отдельные узлы.

LarsH · Answer 2 · 08 ноября 2011

Вы можете попробовать изменить выражение XPath на

"string(/rss/channel/title)"

и использовать тип возврата STRING вместо NODE:

Node node = (Node) xPath.evaluate("string(/rss/channel/title)", doc,
                                  XPathConstants.STRING);

Таким образом, вы выбираете не текстовый узел, а скореестроковое значение элемента title, состоящее из объединения всех его текстовых узлов-потомков.

Как использовать XPath, чтобы найти значение узла с тегом CDATA в Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как использовать XPath, чтобы найти значение узла с тегом CDATA в Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов