Красивый суп, парсинг веб-страниц, проблема с заказом стола transfermarkt - PullRequest
0 голосов
/ 16 июня 2020

Я пытаюсь очистить веб-данные о передаче данных для разных лиг и лет, например, в этой [page] . Проблема в том, что иногда строки в таблицах имеют другой порядок в коде html, чем в визуальной версии страницы. Это вызывает, когда я использую код:

res = requests.get(transfermarkt_link, headers=headers)
res.raise_for_status()
soup = bs4.BeautifulSoup(res.content, 'lxml')
all_tables = soup.find_all('table')

, что загруженные таблицы имеют другой порядок строк. Что отвечает за порядок строк в этих таблицах? Как их очистить в Интернете, сохранив порядок?

...