Мне нужно проанализировать документ HTML, получить все URL и содержимое страницы и сохранить их в базе данных. Я не хочу использовать какую-либо библиотеку. Я могу идентифицировать теги ссылок, используя тег <a
, но как мне извлечь весь контент или полезный текст из тега html?