У меня возникли проблемы при очистке веб-страницы, на которой есть теги <div>
в тегах <p>
.Когда я нахожу div, вывод заканчивается следующим </p>
вместо продолжения </div>
.И вывод, кажется, преобразовал </p>
из исходного кода в.Я пытался использовать другие включающие теги div
, но мой вывод всегда заканчивается до нужного текста.
Исходный код HTML
<p><div class="asdf">Text</p>
<p>More Text</p></div>
Код Python
print(soup.find(class_="asdf"))
Вывод
output = <div class="asdf">Text</div>
Желаемый выход
<div class="asdf">Text</p><p>More Text</p></div>