Получи содержимое <td>в красивом супе - PullRequest
0 голосов
/ 11 августа 2011

Я пытаюсь получить содержимое определенного тега <td> в документе. В настоящее время мой код выглядит так

Для строк в строках:

 data = row.findAll('td')
  for col in data:
      if col.string == 'Address':
         address = col.findNext('td')
         print address

Адрес для печати на консоли показывает это:

<td> 
Victoria Park Ave & McNicoll Ave, Toronto, ON M1W 3Y3, Canada
<br /> <a class="viewmap-link" href="/c-ViewMap?AdId=299616106">View map</a> 
</td> 

Я пытаюсь получить все до этого тега <br/> в "адресе", который я пытался address.string, но он возвращает "Нет".

1 Ответ

0 голосов
/ 11 августа 2011

Используйте метод Tag.getText ()

data = row.findAll('td')
  for col in data:
    if col.string == 'Address':
      address = col.findNext('td')
      print address.getText()

Редактировать: получает весь текст, а не только до <br>. Попробуйте попробовать это вместо

data = row.findAll('td')
  for col in data:
    if col.string == 'Address':
      address = col.findNext('td')
      print address.contents[0]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...