Скребковый стол со случайными селекторами - PullRequest
0 голосов
/ 01 июля 2019

Я пытаюсь очистить данные от здесь . Мне нужно отсортировать результаты по дате. Но когда я приглядываюсь, я вижу, что у них нет универсальных селекторов для выбора строк с одинаковой датой.

Я пытался использовать bs4 и xpath в Selenium, но не смог ничего понять.

Существует ли способ сделать это с использованием селена или bs4.

1 Ответ

0 голосов
/ 02 июля 2019

Я думаю, что проще всего получить всю таблицу на каждой странице, используя soup.find('table', {'id' : 'tournamentTable'}.Вам придется перебирать каждую страницу и использовать панд для df.merge() всех данных вместе.Как только вы это сделаете, используйте datetime, чтобы превратить дату в виде строки в объект даты, который вы можете отсортировать в python.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...