В python, как сохранить абзацы (то есть сохранить новые строки) при использовании lxml.html?
Например, следующий код будет удалять
теги и соединять строки, что нечто я хочу:
body = doc.cssselect("div.body")[0]
content = body.text_content()
Вот то, что я пробовал, это не работает:
- lxml.html.clean.clean_html:
- Won 't сохранить символы новой строки.
- content.replace ("" * 3, "\ n \ n"):
- Не работает согласованно, потому что объединенный текст работаетне иметь одинаковое количество пробелов.