Я пытаюсь исправить файл HTML. Он содержит несколько записей таблицы, и я хотел бы преобразовать его в "ul li" содержимого таблицы.
Я попытался найти все теги "table" и заменил их на "li" (см. Код ниже), но не могу "обернуть" "ul" между списками
<p> Hello world!</p>
<table><tr><td> </td><td>•</td><td><p>First bullet point text</p></td></tr></table>
<table><tr><td> </td><td>•</td><td><p>Second</p></td></tr></table>
<table><tr><td> </td><td>•</td><td><p>Third</p></td></tr></table>
<table><tr><td> </td><td">•</td><td><p>Last</p></td></tr></table>
<p>Some paragraph</p>
<table> </td><td>•</td><td><p>1st item of 2nd list</p></td></tr></table>
<table><tr><td> </td><td>•</td><td><p>2nd item of 2nd list</p></td></tr></table>
<p>Another paragraph</p>
Я сделал следующее:
def replaceBullets(soup):
if soup.find('table'):
for table in soup.findAll('table'):
if isUnordered(table.text):
replacement = soup.new_tag("li")
replacement.string = table.p.text
table.replace_with(replacement)
def isUnordered(line):
if u'\u2022' in line and u'\xa0' in line:
return True
return False
Хотелось бы получить:
<p>Hello world!</p>
<ul><li>First bullet point text</li>
<li>Second</li>
<li>Third</li>
<li>Last</li></ul>
<p>Some paragraph</p>
<ul><li>1st item of 2nd list</li>
<li>2nd item of 2nd list</li></ul>
<p>Another paragraph</p>
но я не могу найти способ вставить тег "ul"