Невозможно очистить данные из таблицы пагинации с помощью BeautifulSoup - PullRequest
0 голосов
/ 25 мая 2020

Я хочу создать парсер для загрузки файлов PDF, упомянутых в таблице, после применения фильтра. Мне трудно очистить данные из результирующей таблицы разбивки на страницы, которая составлена ​​вместо обычных &.

Когда я очищаю, я получаю только класс сценария из родительского div, но не класс div . Я прикрепляю свой код с выходом и целевым родительским классом с желаемой ссылкой в ​​формате pdf

Вот мой код:

URL = 'https://example.com'
web_page = bs4.BeautifulSoup(requests.get(URL, {}).text, "lxml")
main_content= web_page.body.find('div', attrs={'class':'CoveoResultList'})
main_content

Поскольку я делаю PO C, я не могу поделитесь ссылкой, мне дали задание вычистить данные из этой ситуации, и я ничего не могу сказать об этом прямо. Я также делюсь своим выводом при запуске кода и проверяемой структуре элементов.

Inspected elements screenshot

и

My code and Output

...