BeautifulSoup может легко конвертировать html-сущности при синтаксическом анализе документа.
Однако есть ли способ отменить этот шаг при преобразовании его в строку, чтобы я мог снова получить анализируемый вывод?
Вот что я получу:
>>> import BeautifulSoup
>>> BeautifulSoup.BeautifulSoup("<p>a<b</p>", convertEntities=BeautifulSoup.BeautifulSoup.ALL_ENTITIES)
<p>a<b</p>
Вот что я хотел бы получить: <p>a<b</p>