Я только начинаю работать с HTMLUnit, и я собираюсь взять веб-страницу и извлечь из нее необработанный текст без всякой разметки html.
Может ли htmlunit добиться этого? Если так, то как? Или есть другая библиотека, на которую я должен смотреть?
например, если страница содержит
<body><p>para1 test info</p><div><p>more stuff here</p></div>
Я бы хотел вывести
para1 test info more stuff here
спасибо