Question

Допустим, у меня есть Hello world. (перед Hello есть пробел), и я запускаю:

soup = bs(input, "lxml")

Начальный пробел перед Hello world. игнорируется в выходных данных. Как я могу сохранить пробелы перед указанным выше вводом?

Я пробовал другие парсеры, такие как xml, html.parser. Но для меня lxml работает абсолютно нормально, за исключением этого сценария.

Если кто-нибудь может подсказать, как этого избежать, это будет полезно.

Пример:

>>> from bs4 import BeautifulSoup as bs
>>> soup = bs(' Hello world.', "lxml")
>>> soup.p
<p>Hello world.</p>
>>> print(soup)
<html><body><p>Hello world.</p></body></html>

Chetan Patel · Answer 1 · 08 января 2020

Вы должны будете поместить свою строку в тег <p> or <pre>, чтобы сохранить пробел.

Код должен быть таким -

>>> from bs4 import BeautifulSoup as bs
>>> soup = bs('<p> Hello world.</p>', "lxml")
>>> soup.p
<p> Hello world.</p>
>>> print(soup)
<html><body><p> Hello world.</p></body></html>

BeautifulSoup игнорирует пробелы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

BeautifulSoup игнорирует пробелы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов