как разобрать HTML без библиотеки в java? - PullRequest
0 голосов
/ 09 февраля 2020

Мне нужно проанализировать документ HTML, получить все URL и содержимое страницы и сохранить их в базе данных. Я не хочу использовать какую-либо библиотеку. Я могу идентифицировать теги ссылок, используя тег <a, но как мне извлечь весь контент или полезный текст из тега html?

1 Ответ

0 голосов
/ 09 февраля 2020
...