BeautifulSoup игнорирует пробелы - PullRequest
1 голос
/ 08 января 2020

Допустим, у меня есть Hello world. (перед Hello есть пробел), и я запускаю:

soup = bs(input, "lxml")

Начальный пробел перед Hello world. игнорируется в выходных данных. Как я могу сохранить пробелы перед указанным выше вводом?

Я пробовал другие парсеры, такие как xml, html.parser. Но для меня lxml работает абсолютно нормально, за исключением этого сценария.

Если кто-нибудь может подсказать, как этого избежать, это будет полезно.

Пример:

>>> from bs4 import BeautifulSoup as bs
>>> soup = bs(' Hello world.', "lxml")
>>> soup.p
<p>Hello world.</p>
>>> print(soup)
<html><body><p>Hello world.</p></body></html>

1 Ответ

0 голосов
/ 08 января 2020

Вы должны будете поместить свою строку в тег <p> or <pre>, чтобы сохранить пробел.

Код должен быть таким -

>>> from bs4 import BeautifulSoup as bs
>>> soup = bs('<p> Hello world.</p>', "lxml")
>>> soup.p
<p> Hello world.</p>
>>> print(soup)
<html><body><p> Hello world.</p></body></html>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...