BeautifulSoup найти не работает в Threadworker - PullRequest
0 голосов
/ 21 сентября 2018

Этот код прекрасно работает в python3, и команда print показывает содержимое страницы веб-страницы, которая была загружена через urllib.request.urlopen и перенаправлена ​​в функцию.Однако, когда функция вызывается в Threadworker после печати, циклы for не возвращают никакой информации.

def meta_data(page_result):
    _side = {
            'expires': '',
            'generator': ''
           }
    soup = BeautifulSoup(page_result, "lxml")

    print(soup)
    # get meta infos
    for tag in soup.find_all('meta', attrs={'name': 'expires'}):
        if 'content' in str(tag):
            tag = str(tag)
            tag = str(tag.split('"')[1:2])
            tag = clean_string(tag)
            _side['expires'] = tag

    for tag in soup.find_all('meta', attrs={'name': 'generator'}):
        if 'content' in str(tag):
            tag = str(tag)
            tag = str(tag.split('"')[1:2])
            tag = clean_string(tag)
            _side['generator'] = tag

    return _side

Есть ли какое-либо расширение?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...