удаление тега href из cdata - PullRequest
       0

удаление тега href из cdata

0 голосов
/ 03 апреля 2012

У меня есть следующий XML-файл:

<ab>
 <![CDATA[ 

    <table>
        <tbody>
            <tr>
                <th>abcdef</th>             
            </tr>
            <tr>
             <p>
              <a href="/1/2" target="_blank">Home</a>
             </p>
            </tr>
        </tbody>
    </table>
 ]]>
</ab>

Я хочу удалить тег href со ссылкой на 1/2. Как и в примере выше, я хочу удалить ссылку href с помощью xpath и оставить только текст: Home.

1 Ответ

1 голос
/ 03 апреля 2012

CDATA - это просто строка произвольного текста, пока вы его не обработаете.

Итак:

  1. Извлечь потомок textNode для <ab>
  2. Запустить его через анализатор HTML
  3. Запустить XPath на выходе изпарсер
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...