Допустим, у меня есть Hello world.
(перед Hello есть пробел), и я запускаю:
soup = bs(input, "lxml")
Начальный пробел перед Hello world.
игнорируется в выходных данных. Как я могу сохранить пробелы перед указанным выше вводом?
Я пробовал другие парсеры, такие как xml, html.parser
. Но для меня lxml
работает абсолютно нормально, за исключением этого сценария.
Если кто-нибудь может подсказать, как этого избежать, это будет полезно.
Пример:
>>> from bs4 import BeautifulSoup as bs
>>> soup = bs(' Hello world.', "lxml")
>>> soup.p
<p>Hello world.</p>
>>> print(soup)
<html><body><p>Hello world.</p></body></html>