Извлечь содержимое <Script>в Python с BeautifulSoup - PullRequest
0 голосов
/ 15 сентября 2018

Я хочу извлечь значение окна. FEED__INITIAL__STATE

Кусок кода

Как я могу это сделать?

Ответы [ 2 ]

0 голосов
/ 15 сентября 2018

Сначала мы должны найти все теги сценариев, а затем сопоставить их

p.s - обновлено в RasitAydin код

import requests
from bs4 import BeautifulSoup


def check_script_tag(url):
    r = requests.get(url)
    parsed_html = BeautifulSoup(r.content, features="html.parser")

    script_tags = parsed_html.body.find_all('script')
    for script_tag in script_tags:
        text = script_tag.text
        if 'window.FEED__INITIAL__STATE'.lower() in text.lower():
            print(text)


check_script_tag(" YOUR WEB URL")
0 голосов
/ 15 сентября 2018

Может быть, вам стоит попробовать вот так:

import requests
from bs4 import BeautifulSoup

def check_script_tag(url):

    r = requests.get(url)
    parsed_html = BeautifulSoup(r.content, features="html.parser")

    try:
        text = parsed_html.body.find('script').text
        print (text)  # Here text in script tag !!
    except AttributeError:
        print("There is no script tag !!")

check_script_tag("https://stackoverflow.com")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...