BeautifulSoup задыхается при разборе следующего кода:
>>> soup = BeautifulSoup('<img src="#" alt="Click Here >" border="0" />')
>>> soup.prettify()
'<img src="#" alt="Click Here >" />\n" border="0" />\n'
Следует также отметить, что я не могу контролировать ввод html.Существует много различных вариантов текста / атрибутов, поэтому я хочу избегать использования Regex.
У кого-нибудь есть предложение не использовать BeautifulSoup для автоматического закрытия тега img, когда он встречается с символом «>»?
Редактировать 1: я нашел это в документации.Могу ли я контролировать, как BeautifulSoup анализирует тег IMG?
Редактировать 2: Я решил свою проблему.Прежде чем я позвонил в BS, я сделал текст заменить
text.replace('>"','>"')