Проблемы с поиском элементов по классу с красивым супом - PullRequest
0 голосов
/ 01 февраля 2019

Я пытаюсь получить название событий на этой странице, используя красивый суп 4: https://www.orbitxch.com/customer/sport/1

Я пытался отфильтровать HTML-код по тегам с class = "biab_item-link biab_market-linkjs-event-link biab_has-time ", кажется, это те, которые содержат каждое уникальное имя события один раз.

Вот мой код

from bs4 import BeautifulSoup
import urllib3


http = urllib3.PoolManager()

url = 'https://www.orbitxch.com/customer/sport/1'
response = http.request('GET', url)
soup = BeautifulSoup(response.data, features="lxml")



for tag in soup.find_all("a", class_="biab_item-link biab_market-link js-event-link biab_has-time"):
        print(tag["title"])

Но ничего не происходит.

1 Ответ

0 голосов
/ 01 февраля 2019

Это потому, что HTML-контент динамически изменяется с помощью JavaScript.Данные пришли с этого URL: https://www.orbitxch.com/customer/api/event-updates?eventIds=29108154,29106937,29096310,29096315,29106936,29096313,29096309,29096306,29107821,29108318,29106488,29106934,29106830,29106490,29104420, но, честно говоря, я не знаю, где вы можете найти эти идентификаторы.Этот URL возвращает ответ JSON, который вы можете легко проанализировать с помощью библиотеки Python.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...