Я пытаюсь очистить данные таблицы со следующего веб-сайта: https://fantasyfootball.telegraph.co.uk/premier-league/statscentre/
Цель состоит в том, чтобы получить все данные игрока и сохранить их в словаре.
Я использую BeautifulSoup и могу найти таблицу в содержимом html, однако возвращаемое тело таблицы пустое.
Читая другие сообщения, я увидел, что это может быть связано с тем, как веб-сайт медленно загружает данные таблицы после загрузки веб-сайта, но я не смог найти способ обойти проблему.
Мой код выглядит следующим образом:
from bs4 import BeautifulSoup
import requests
# Make a GET request to feth the raw HTML content
html_content = requests.get(url).text
# Parse the html content
soup = BeautifulSoup(html_content, "lxml")
# Find the Title Data within the website
player_table = soup.find("table", attrs={"class": "player-profile-content"})
print(player_table)
В результате я получаю следующее:
<table class="playerrow playlist" id="table-players">
<thead>
<tr class="table-head"></tr>
</thead>
<tbody></tbody>
</table>
Фактический код HTML на веб-сайте довольно длинный, так как они упаковывают много данных в каждый <tr>
, а также в последующие <td>
, поэтому я не буду размещать это здесь, если кто-то не спросит. Достаточно сказать, что в строке заголовка есть несколько <td>
строк, а также несколько строк <tr>
в теле.