помощь в получении изображения src из ячейки таблицы с помощью BeautifulSoup - PullRequest
1 голос
/ 31 июля 2010

Итак, у меня есть html-страница с формой и таблица внутри формы с рядами продуктов.

Я дошел до того момента, когда я перебираю строки таблицы, и в каждом цикле я беру все ячейки таблицы.

for tr in t.findAll('tr'):
    td = tr.findAll('td')

Теперь я хочу получить изображение src url с первого тд.

HTML выглядит так:

<tr>
  <td ...>
    <a href ... >
       <img ... src="asdf/asdf.jpg" .. >
    </a>
  </td>

  ...
</tr>

Как бы я поступил так? Я продолжаю думать в терминах регулярных выражений.

Я пытался:

td[0].a.image.src но это не сработало, так как в нем нет атрибута 'src'.

1 Ответ

6 голосов
/ 31 июля 2010

Используйте

td[0].a.img['src']

Я полагаю, что использование image для img в вопросе было просто ошибкой транскрипции, но важным моментом является то, что в BeautifulSoup для доступа к атрибутам HTML тега используется индексная нотация (например, ['src'] в моем фрагменте кода выше), а не с точечным синтаксисом - нотация с точечным синтаксисом фактически идет вниз по дереву (так же, как это происходит выше для двух точек, по одной перед a и img).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...