Я пишу общий html-парсер и хочу иметь возможность извлечь все теги из данного тега. Поскольку это общий синтаксический анализатор, внешние теги могут содержать один или несколько внутренних тегов, и они могут быть просто любым HTML-тегом, поэтому я не могу использовать такие методы, как find. Я также пытался использовать .contents, но он возвращает результат в виде списка, но я просто хочу, чтобы теги были такими, какие они есть, чтобы их можно было затем анализировать как теги bs4.
Например: с учетом следующего HTML:
<tr><th>a</th><th>b</th></tr>
Мне нужно извлечь следующее, гарантируя, что он по-прежнему имеет тип тега bs4
<th>a</th><th>b</th>