Вырежьте указанную c часть из строки, удалите теги HTML. [Соскоб в Интернете] - PullRequest
0 голосов
/ 18 марта 2020

Я получаю результаты вроде:

<a class="ellipsis" href="https://www.link.com" title="Name of the hyperlink ">Name of the hyperlink </a>

Я хочу извлечь ссылку только для одной переменной ex. ссылка и имя для другого бывшего. имя. Это мой код.

def supa(linko):
    r = get(linko, headers=ua)
    return BeautifulSoup(r.content, 'html.parser')


soup = supa(base_url + search)
the_icons = soup.find_all('div', class_='caption')

for icon in the_icons:
    name = icon.find('a', class_='ellipsis')

    print(name)

1 Ответ

0 голосов
/ 18 марта 2020

Вы можете просто добавить ['href'] в конце поиска:

for icon in the_icons:
    name = icon.find('a', class_='ellipsis')['href']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...