BeautifulSoup - предотвращает автоматическое закрытие тега - PullRequest
1 голос
/ 16 июня 2011

BeautifulSoup задыхается при разборе следующего кода:

>>> soup = BeautifulSoup('<img src="#" alt="Click Here >" border="0" />')
>>> soup.prettify()
'<img src="#" alt="Click Here &gt;" />\n" border="0" />\n'

Следует также отметить, что я не могу контролировать ввод html.Существует много различных вариантов текста / атрибутов, поэтому я хочу избегать использования Regex.

У кого-нибудь есть предложение не использовать BeautifulSoup для автоматического закрытия тега img, когда он встречается с символом «>»?

Редактировать 1: я нашел это в документации.Могу ли я контролировать, как BeautifulSoup анализирует тег IMG?

Редактировать 2: Я решил свою проблему.Прежде чем я позвонил в BS, я сделал текст заменить

text.replace('>"','&gt;"')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...