Question

Я пишу HTML-документ с BeautifulSoup и хотел бы, чтобы он не разбивал встроенный текст (например, текст внутри тега ) на несколько строк. Проблема, которую я получаю, заключается в том, что синтаксический анализ abc с prettify дает мне вывод

<p>
  a
<span>
b
</span>
c
</p>

и теперь HTML отображает пробелы между a, b, c, что мне не нужно. Как мне избежать этого?

Michał Marczyk · Answer 1 · 23 января 2010

Как насчет того, чтобы вообще не использовать prettify?

BeautifulSoup.BeautifulSoup('<p>a<span>b</span>c</p>').renderContents()

выводит оригинальный HTML без лишних пробеловНапример, вы можете использовать, например, Firebug, чтобы более подробно рассмотреть структуру документа, и вам не нужно будет «предварительно проверять» его во время создания.

Alex Martelli · Answer 2 · 23 января 2010

Я бы просто сделал:

from BeautifulSoup import BeautifulSoup

ht = '<p>a<span>b</span>c</p>'
soup = BeautifulSoup(ht)
print soup

и избегайте лишних пробелов. Работа prettify заключается в том, чтобы точно настроить пробелы для четкого отображения структуры дерева разбора HTML, в конце концов ...!

Встроенный анализ в BeautifulSoup в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Встроенный анализ в BeautifulSoup в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов