Визуализация HTML веб-страницы в текст на Java - PullRequest
0 голосов
/ 07 сентября 2010

Я хотел бы получить текстовое представление веб-сайта в человек -читаемой форме, например, гиперссылки или поля ввода.
Есть ли библиотека, которая делает это? (Я проверил Jericho Renderer, но он не показывает поля ввода)
Например

<div>
<form action="example.php">
Name:
<input type="text" name="name_field">
<input type="button" value="OK">
</form>
</div>

примерно так

Name: [________] [OK]

1 Ответ

0 голосов
/ 07 сентября 2010

Попробуйте пометить суп и постройте его самостоятельно. Вы получаете модель HTML DOM и можете выплевывать текст.

...