Экранирование HTML символов / тегов в XML полезной нагрузке - PullRequest
0 голосов
/ 18 июня 2020

Мне нужен код JAVA для обработки экранирования HTML символов в XML полезной нагрузке. Может кто-нибудь, пожалуйста, поделитесь кодом для этого.

В полезных данных XML есть одно поле описания, имеющее содержимое, подобное приведенному ниже -

<Description>&lt;ul&gt;&lt;li&gt;This is a &lt;strong&gt;test&lt;/strong&gt; of the &lt;em&gt;new &lt;/em&gt;&lt;span
       style=&quot;font-size: 14px;&quot;&gt;rich &lt;/span&gt;&lt;u&gt;text &lt;/u&gt;&lt;s&gt;feature &lt;/s&gt;it
       &lt;sub&gt;includes &lt;/sub&gt;as &lt;sup&gt;many &lt;/sup&gt;special characters as
       possible&lt;ul&gt;&lt;li&gt;&lt;span style=&quot;color: rgb(231,76,60);&quot;&gt;test &lt;/span&gt;&lt;span
       style=&quot;background-color: rgb(46,204,113);&quot;&gt;line
       &lt;/span&gt;2&lt;/li&gt;&lt;/ul&gt;&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align:
       center;&quot;&gt;Center&lt;/div&gt;&lt;div style=&quot;text-align:
       center;&quot;&gt;&amp;nbsp;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;Right&lt;/div&gt;
</Description>

И нам нужно преобразовать это в простые символы, например ниже -

Это тест новой функции форматированного текста, он включает как можно больше специальных символов. Тестовая строка 2 Центр

Справа

1 Ответ

0 голосов
/ 18 июня 2020

Apache Commons Text имеет методы StringEscapeUtils#escapeHtml4(String) и #unescapeHtml4(String) именно для этой проблемы. Официальная документация: https://commons.apache.org/proper/commons-text/javadocs/api-release/org/apache/commons/text/StringEscapeUtils.html#unescapeHtml4 - java .lang.String-

Поиск в Google по запросу «Java escape HTML entity» легко нашел бы эту информацию за секунды, кстати.

...