Пока у меня есть следующий скрипт:
from mechanize import Browser
from BeautifulSoup import BeautifulSoup
import re
import urllib2
br = Browser()
br.open("http://www.foo.com")
html = br.response().read();
soup = BeautifulSoup(html)
items = soup.findAll(id="info")
, и он отлично работает и приводит к следующим "элементам":
<div id="info">
<span class="customer"><b>John Doe</b></span><br>
123 Main Street<br>
Phone:5551234<br>
<b><span class="paid">YES</span></b>
</div>
Однако я бы хотелвозьмите предметов и очистите его, чтобы получить
John Doe
123 Main Street
5551234
Как вы можете удалить такие теги в BeautifulSoup и Python?
Как всегда, спасибо!