BeautifulSoup убирает встроенный контент CSS и javascript - PullRequest
0 голосов
/ 09 июня 2010

эй, ребята, делает ли BeautifulSoup содержимое CSS и JavaScript? после использования

content3 = ''.join(BeautifulSoup(content).findAll(text=True))

Я до сих пор их задерживаю.

1 Ответ

0 голосов
/ 09 июня 2010

Что именно вы хотите удалить, все элементы скрипта и стиля? Это должно быть что-то вроде:

''.join(BeautifulSoup(content).findAll(text=lambda text: 
text.parent.name != "script" and 
text.parent.name != "style"))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...