Как извлечь текст из тега шрифта с помощью Beautifulsoup - PullRequest
1 голос
/ 24 марта 2012

Я делаю свою первую программу с Beautifulsoup, и мой HTML-файл имеет фрагмент кода, подобный этому

......
......
......

<font face="verdana" size="3">5 n i D 1 C</font>
......
......

Я хочу извлечь 5 n i D 1 C из тега <font>. Я делаю

ele=soup('font', face="verdana",size="3"), затем

ele.Contents()

но я получаю ошибку AttributeError: 'ResultSet' object has no attribute 'font' когда я делаю

 print ele

вывод

[<font face="verdana" size="3">5 n i D 1 C</font>]

это означает, что он ищет правильно, пожалуйста, помогите мне, как извлечь данный текст.

Спасибо

Ответы [ 2 ]

3 голосов
/ 24 марта 2012
ele[0].contents[0]
u'5 n i D 1 C'
1 голос
/ 24 марта 2012

Попробуйте сделать

ele[0].Contents()

вместо

ele.Contents()

ele - ResultSet, а не первый результат, может потребоваться проверить документацию на предмет того, что возвращает только первый результат. Я не знаком с BeautifulSoup

...