Я работаю с XPATH, Java и хочу извлечь текст из одной HTML-страницы.
Текст находится под некоторым div с несколькими пробельными символами между ними, например
<br>
и т. Д.
Я хочу, чтобы они были преобразованы в 'space' и 'newline' соответственно при извлечении.
Метод, который я использую для извлечения текста, это Element.getTextContent (), который не учитывает пробельные символы.
Может кто-нибудь сказать мне, если есть способ извлечь текст с нормализацией пробелов
ИЛИ ЖЕ
Извлеките всю HTML-разметку под «Узлом», чтобы я мог заменить ее самостоятельно.
Спасибо
Найн