хочу получить текст с метки с помощью Beautifulsoup, попробовал все, но не работает - PullRequest
0 голосов
/ 03 марта 2019

Я хочу получить этот «отклоненный» текст с ярлыка, я перепробовал так много вещей, но у меня ничего не получалось.

import bs4
import requests
url="example"

agent = {
    "User-Agent": 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36'}
data = requests.get(url, headers=agent)
soup = bs4.BeautifulSoup(data.text, 'html.parser')

# rejects = soup.select("label._1TSOc")
#rejects = soup.find("label._1TSOc")
#rejects = soup.find("label._1TSOc._3Gol_")
rejects  = soup.find("label",{"class":"_1TSOc"})
print(rejects) #checking either getting data or not, but OUTPUT: None    

for i in rejects:
    print(i.text) #not working

enter image description here

enter image description here

Ответы [ 2 ]

0 голосов
/ 04 марта 2019

«отклонено» - это не ваш data.text, даже если он присутствует при проверке кода.
Это означает, что он добавляется позже некоторыми (java) сценариями и не будет доступен через Beautifulsoup,так как при этом выполняются сценарии.
Вам потребуется использовать браузер без монитора для доступа к полностью загруженному и запущенному состоянию страницы после загрузки и выполнения всех сценариев.На этом сайте есть множество ответов!
См., Например, Безголовый браузер для Python (ТРЕБУЕТСЯ поддержка Javascript!)
Вы также можете посмотреть на activesoup https://pypi.org/project/activesoup/ или накак рулить хромом из питона.

0 голосов
/ 04 марта 2019

Вы пробовали один из них?

rejects  = soup.find("label",{"class":" _1TSOc _3Gol_ "})
print(rejects.text)

или

rejects  = soup.find("label",{"data-aut-id":"statusLabel"})
print(rejects.text)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...