Я хотел бы обернуть новый <tr>
вокруг блока html, но в html нет никаких уникальных тегов, которые я мог бы использовать, чтобы различать начало и конец тега. Я новичок в использовании BeautifulSoup, и в целом кажется, что когда я манипулирую объектом супа, он манипулирует целым тегом. Мне было трудно из-за этого потом работать с несколькими тегами, которые никоим образом не идентифицируются, кроме как по их тексту. HTML выглядит как
<td>
<th>Id</th>
<td>1234</td>
<th>something</th>
<td>some text</td>
<th>Id</th>
<td>2345</td>
<th>anything</th>
<td>other text</td>
</td>
Мне бы хотелось обернуть каждый раз, когда я вижу <th>Id</th>
в теге <tr>
, такой, что он выглядит так:
<td>
<tr>
<th>Id</th>
<td>1234</td>
<th>something</th>
<td>some text</td>
</tr>
<tr>
<th>Id</th>
<td>2345</td>
<th>anything</th>
<td>other text</td>
</tr>
</td>
Я также пытался использовать регулярные выражения, но, поскольку Id - единственный непротиворечивый заголовок таблицы, в то время как все остальные заголовки также выделяются тегами <th>
, я не получил правильную комбинацию.