Удалить несколько тегов html из домена html - PullRequest
0 голосов
/ 05 апреля 2020

у меня ниже html таблица. Я хочу преобразовать его в xml. Я сделал свое кодирование, как показано ниже, в результате чего он сначала преобразуется в html dom, а позже я преобразую его в xml. Моя проблема в том, что я просто хочу оставить тег, и

остальная часть тега не должна быть зафиксирована в документе. Как я могу это сделать? Как я хотел бы изменить таблицу html на таблицу xml. Поэтому после этого я смогу использовать список для вставки данных в класс, который затем будет преобразован в xml.

builder = factory.newDocumentBuilder();     
is = new InputSource(new StringReader(tableInString));
document = builder.parse(is);
document.getDocumentElement().normalize();
<table style="width: 100%;">
    <colgroup>
        <col style="width: 20%;"/>
        <col style="width: 20%;"/>
        <col style="width: 50%;"/>
        <col style="width: 10%;"/>
    </colgroup>
    <tbody>
        <tr>
            <th colspan="1">
                <p>Header1</p>
            </th>
            <th colspan="2">
                <span><div>Header2</div></span>
            </th>
            <th colspan="1">
                p><a><strong>Header3</strong></a></p>
            </th>
        </tr>
        <tr>
            <td colspan="1">
                <div>Value1</div>
            </td>
            <td colspan="2">
                <span><div>Value2</div></span>
            </td>
            <td colspan="1">
                <p><a><strong>Value3</strong></a></p>
            </td>
        </tr>
    </tbody>
</table>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...