извлечение элемента и вставка пробела - PullRequest
16 голосов
/ 24 июня 2011

я разбираю html используя BeautifulSoup в python

Я не знаю, как вставить пробел при извлечении текстового элемента

это код:

import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>')
print soup.text

тогда вывод

thisisexample

но я хочу вставить пробел к этому как

Да, это пример

как мне вставить пробел?

Ответы [ 2 ]

38 голосов
/ 24 июня 2011

Используйте getText вместо:

import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>')

print soup.getText(separator=u' ')
# u'this is example'
2 голосов
/ 24 июня 2011

Если ваша версия Beautifulsoup не имеет getText, вы можете сделать это:

In [26]: ' '.join(soup.findAll(text=True))
Out[26]: u'this is example'
...