Ссылка на шестнадцатеричный код HTML-объекта не работает - PullRequest
0 голосов
/ 05 декабря 2018

Я пытаюсь сбежать и убрать html-сущности.Для Escape я использовал приведенный ниже код, который отлично работает.

function reformat(string) {
var entityMap = {
    '&' : '&',
    '<' : '&lt;',
    '>' : '&gt;',
    '"' : '&quot;',
    "'" : "'",
    '/' : '/',
    '`' : '&#x60;',
    '=' : '=',
    '■' : '&#x25a0;',
    '▲' : '&#x25b2;'
};

if (string) {
    return String(string).replace(/[&<>"'`=■▲\/]/g,
            function fromEntityMap(s) {
                return entityMap[s];
            });
}

};

Для Unescaping я попытался использовать JSOUP Parser,

        Jsoup.parse(html).text();
        boolean strictMode = true;
        html = org.jsoup.parser.Parser.unescapeEntities(html, strictMode);

HTMLUtils: org.springframework.web.util.HtmlUtils

html = HtmlUtils.htmlUnescape(html);

Uebescape: org.unbescape.html.HtmlEscape

html = HtmlEscape.unescapeHtml(html);

Кроме того, я пробовал использовать commons-lang и commons-text,Тем не менее, мне не повезло, что я могу удалить эти два символа.

     '■' : '&#x25a0;',
    '▲' : '&#x25b2;', 

Примечание: я использую HEX CHARACTER REFERENCE.

1 Ответ

0 голосов
/ 17 декабря 2018

У меня был конфликт в classpath, было две разные версии JSOUP 1.6.0 и JSOUP 1.11.3.Я только что удалил jsoup1.6.0, и все начало работать.

У нас нет метода org.jsoup.parser.Parser.unescapeEntities (html, true) в версии Jsoup-1.6.0.

...