Я очищаю текст от нежелательных тегов HTML (например, <script>
) с помощью
String clean = Jsoup.clean(someInput, Whitelist.basicWithImages());
Проблема в том, что он заменяет, например, å
на å
(что вызывает у меня проблемы, поскольку это не "чистый xml").
Например
Jsoup.clean("hello å <script></script> world", Whitelist.basicWithImages())
1012 * выходы *
"hello å world"
но я бы хотел
"hello å world"
Есть ли простой способ добиться этого? (То есть проще, чем преобразовать å
обратно в å
в результате.)