Python соскоб href настроить URL - PullRequest
       11

Python соскоб href настроить URL

0 голосов
/ 06 октября 2018

Этот код работает для URL http://www.schulliste.eu/schule/, но не для http://www.schulliste.eu/type/gymnasien/ Кто-нибудь знает почему?Я думаю, что это как-то связано с ключевым словом "заголовок". Также мне нравится, когда простые адреса электронной почты (без скобок и кавычек) находятся между собой, это возможно?

import requests
from bs4 import BeautifulSoup as soup

def get_emails(_links: list, _r=[0, 10]):
    for i in range(*_r):
        new_d = soup(requests.get(_links[i]).text,         'html.parser').find_all('a', {'class':'my_modal_open'})

        if new_d:
            yield new_d[-1]['title']

d = soup(requests.get('http://www.schulliste.eu/schule/').text, 'html.parser')

results = [i['href'] for i in d.find_all('a')][52:-9]
print(list(get_emails(results)))

1 Ответ

0 голосов
/ 06 октября 2018
  1. Я полагаю, что это не работает, б / с искомый элемент 'a', {'class':'my_modal_open'} не найден по второй ссылке.
  2. Чтобы напечатать его без кавычек, вы можете попробовать это:

items = list(get_emails(results)) for item in items: print(item)

...