Как сохранить перевод строки при анализе с помощью TagSoup? - PullRequest
0 голосов
/ 27 марта 2012

У меня очень простой и короткий вопрос: есть ли способ сохранить разрывы строк, используя JSoup для извлечения текста?Когда я использую метод .text (), все теги
, похоже, игнорируются.Если я заменил теги
на «\ n» и снова проанализировал их для вывода .text (), эти разрывы строк также игнорируются.Итак, это выполнимо?Или я должен реализовать что-то свое или попробовать использовать какой-нибудь другой HTML-парсер?

Заранее спасибо!

1 Ответ

1 голос
/ 27 марта 2012

Вы можете очистить html и оставить только теги <br> и <p> (или только <br>), а затем просто заменить эти теги на "\ n"

...