парсинг данных сайта с BeautifulSoup - PullRequest
0 голосов
/ 13 марта 2012

Я хочу извлечь определенное число с сайта.

String1&nbsp;:&nbsp; <font style="color:#EE6564;" > 
112.674448 </font>&nbsp;handle <br/>

String2&nbsp;:&nbsp; <font style="color:#EE6564;" > 
60.90402 </font>&nbsp;handle  <br/>

String3&nbsp;:&nbsp; <font style="color:#EE6564;" > 
51.770428 </font>&nbsp;handle  <br/>

String4&nbsp;:&nbsp; <font style="color:#EE6564;" > 
182712 </font>&nbsp;handle  <br/>

Я хочу получить значение после String1, которое равно 112.674448, но я не могу найти способ. я пробовал

soup.findAll(text="String1&nbsp;:&nbsp;") 

но это ничего не находит так же как

soup.findAll(text="String1")

1 Ответ

0 голосов
/ 13 марта 2012

Прежде всего, вы можете дать уникальный идентификатор шрифта Tag, а затем вы можете сделать что-то вроде:

from BeautifulSoup import BeautifulSoup

html = \
"""
String1&nbsp;:&nbsp; <font style="color:#EE6564;" > 
112.674448 </font>&nbsp;handle <br/>

String2&nbsp;:&nbsp; <font id="font1" style="color:#EE6564;" > 
60.90402 </font>&nbsp;handle  <br/>

String3&nbsp;:&nbsp; <font style="color:#EE6564;" > 
51.770428 </font>&nbsp;handle  <br/>

String4&nbsp;:&nbsp; <font style="color:#EE6564;" > 
182712 </font>&nbsp;handle  <br/>"""

soup = BeautifulSoup(html)

soup.findAll("font",id="font1")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...