Некоторые пояснения:
"B \u0026 M Collision Repair"
- это не HTML. "B & M Collision Repair"
- это HTML.
Java для HTML
"B \u0026 M Collision Repair"
не является HTML.Это литерал Java String , или как вы создаете строку в коде Java.Символы Unicode хранятся в виде декодированных необработанных символов.Нотация \u
используется только для экранирования символов Юникода при создании строки, она не сохраняется таким образом.Примечание: поскольку этот символ амперсанда находится в диапазоне ISO-8859-1, его не нужно экранировать таким образом."B & M Collision Repair"
- это то же самое в Java.
Преобразование строк Java в HTML является обычным явлением, и его следует выполнять для отображения строк Java в веб-браузере.Это будет называться кодировка HTML .
Чтобы преобразовать строку Java в HTML, тем самым кодируя необработанные символы Unicode Java в объекты HTML:
String java = "B \u0026 M Collision Repair";
#=> (String) "B \u0026 M Collision Repair"
#=> (String) "B & M Collision Repair"
String html = Html.escapeHtml(html);
#=> (String) "B & M Collision Repair"
#=> (String) "B & M Collision Repair"
#or
String html = Html.toHtml(html).toString();
#=> (String) "B & M Collision Repair"
#=> (String) "B & M Collision Repair"
HTML в Java
"B & M Collision Repair"
- это HTML.Символы Unicode хранятся в виде закодированных символов.Обозначение &#x;
используется для экранирования символов Юникода для передачи по ISO-8859-1.Веб-браузер декодирует их для отображения фактических символов Юникода.
Преобразование HTML в строки Java встречается реже и обычно зарезервировано для «очистки» или «разбора» строк Java для хранения и отображения в некоторых системах, которые неподдержка HTML.Это будет называться декодирование HTML .
Чтобы преобразовать HTML в строку Java, тем самым декодируя HTML-объекты в необработанные символы Unicode Java:
String html = "B & M Collision Repair";
#=> (String) "B & M Collision Repair"
String java = Html.fromHtml(html).toString();
#=> (String) "B \u0026 M Collision Repair"
#=> (String) "B & M Collision Repair"