У меня есть такой HTML-текст:
<xml ... >
и я хочу преобразовать его в нечто читаемое:
<xml ...>
Есть ли простой (и быстрый) способ сделать это в Python?
Официальная документация для HTMLParser: Python 2.7
HTMLParser
>>> import HTMLParser >>> pars = HTMLParser.HTMLParser() >>> pars.unescape('© €') u'\xa9 \u20ac' >>> print _ © €
Официальная документация для HTMLParser: Python 3
>>> from html.parser import HTMLParser >>> pars = HTMLParser() >>> pars.unescape('© €') © €
Здесь есть функция , которая делает это, как указано в посте, на который указал Фред Скопировано здесь, чтобы сделать вещи проще.
Благодарим Фреда Ларсона за ссылку на другой вопрос о SO. Благодарим dF за публикацию ссылки.