Как скрести сложную таблицу в питоне? - PullRequest
0 голосов
/ 06 марта 2019

Поэтому я пытаюсь сгладить шансы на ставки со страницы, после того, как я пробовал много сайтов и обнаружил, что Beautiful Soup не найдет ВСЕ необходимые классы, я попал на этот. Проблема в том, что он отформатирован очень плохо. В любом случае, вот мой код.

import requests
import lxml.html as lh

tennis_url = requests.get("http://odds.aussportsbetting.com/betting?competitionid=1", headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36'})
page = lh.fromstring(tennis_url.content)
tr_elements = page.xpath('//tr')
print([len(T) for T in tr_elements[0:-1]])

Вот сайт: http://odds.aussportsbetting.com/betting?competitionid=1

Это показывает мне, что в каждой строке есть куча разных столбцов и что они использовали таблицу, чтобы структурировать весь сайт почти ??

Мне действительно нужна помощь и я хочу перебрать все эти строки и столбцы, чтобы просто получить нужные мне строки. Более конкретно шансы: 0

Любая помощь очень ценится!

...