как получить iframe src в красивом супе без noscript - PullRequest
0 голосов
/ 27 января 2019

хочу ползти с красивым супом.Тем не менее, я пытаюсь найти источник iframe, потому что мне нужно значение внутри iframetag, но это значение не может быть получено, потому что выполняется тег noscript.Нужно ли отправлять другой запрос в шапку?Пожалуйста, помогите мне.

    for test2 in test :
    print(test2.text)

    req_cmt = requests.get(
        test2.get('href'),
        stream=True, headers={'User-agent': 'Mozilla/5.0'})
    html_cmt = req_cmt.text
    soup_cmt = BeautifulSoup(html_cmt, 'html.parser')

    cmt = soup_cmt.findAll('iframe')

    print(cmt)
    src_string = str()
    for iframe in cmt :
        src_string = iframe.get('src')
        print(src_string)

Ниже приведены теги iframetag и noscript, которые являются проблематичными.

<iframe frameborder="0" height="1" marginheight="0" marginwidth="0" scrolling="no" src="//b.yjtag.jp/iframe?c=8P8rc6G" width="1"></iframe>
<noscript>
<iframe src="//b.yjtag.jp/iframe?c=8P8rc6G" width="1" height="1" frameborder="0" scrolling="no" marginheight="0" marginwidth="0"></iframe>

Если я импортирую свойство src из iframe, онвыглядит следующим образом:

// b.yjtag.jp/iframe?c=8P8rc6G

...