Получение href в строке html - PullRequest
0 голосов
/ 30 октября 2018

Я использую BeautifulSoup для получения информации из HTML-таблицы. В частности, я пытаюсь получить href = ... в следующей строке:

<a class="block" href="/post/BpkL7ColOVj" style="background-image: url(https://scontent-ort2-2.cdninstagram.com/vp/09e1b7436c9125092433c041c35c1eaa/5BDB064D/t51.2885-15/e15/s480x480/43913877_2130106893692252_5245480330715053223_n.jpg)">

soup.find_all('a', attrs={'class':'block'})

Есть ли другой способ использования BeautifulSoup, чтобы получить то, что содержится в href?

Спасибо!

1 Ответ

0 голосов
/ 30 октября 2018

Просто используйте ['attribute_name'], чтобы получить атрибуты по имени.

soup.find_all('a', attrs={'class':'block'})[0]['href']
>>> '/post/BpkL7ColOVj'

Вы также можете использовать css selector, который я считаю более простым:

soup.select('a.block')[0]['href'] # same thing.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...