Я получил html-фрагмент следующим образом:
<span class=#article-title#>About《About<SomeChineseChars》Blabla</span>
извините, здесь я использую символы латинского алфавита, так как редактор не позволяет вводить символы китайского языка
когда я попытаюсь извлечь текст из этого элемента, используя
doc.select(".article-title").text();
, в результате я получу следующее:
About《About》Blabla
после отладки программирования, обнаружив, что
<SomeChineseChars>
обрабатывался как тег HTML, и JSoup автоматически закрывал тег следующим образом:
<SomeChineseChars></SomeChineseChars>
Итак, если есть что-либо, чтобы избежать этого, или если это ошибка?
- = - = - = ОБНОВЛЕНИЕ = - = - = -
после создания dom и проверки проанализированного html, вывод будет
Я не могу опубликовать img,поэтому, пожалуйста, нажмите меня, чтобы просмотреть его
Большое спасибо, Бен