Я работаю над веб-парсером, используя urllib.Мне нужно иметь возможность сохранять только те строки, которые находятся внутри определенного тега div.например: я сохраняю весь текст в div "body".Это означает, что весь текст внутри тегов div будет возвращен.Это также означает, что если в нем есть другие элементы div, это нормально, но как только я нажимаю на родителя, он останавливается.Есть идеи?
Моя идея
поиск нужного вам div.
Запишите положение.
Следите за любыми делами в будущем.+1 для нового div -1 для конечного div.
когда вы вернетесь к 0, ваш родительский div?Сохранить местоположение.
Затем сохранить данные от начального номера до конечного номера?