Я хочу создать парсер для загрузки файлов PDF, упомянутых в таблице, после применения фильтра. Мне трудно очистить данные из результирующей таблицы разбивки на страницы, которая составлена вместо обычных &.
Когда я очищаю, я получаю только класс сценария из родительского div, но не класс div . Я прикрепляю свой код с выходом и целевым родительским классом с желаемой ссылкой в формате pdf
Вот мой код:
URL = 'https://example.com'
web_page = bs4.BeautifulSoup(requests.get(URL, {}).text, "lxml")
main_content= web_page.body.find('div', attrs={'class':'CoveoResultList'})
main_content
Поскольку я делаю PO C, я не могу поделитесь ссылкой, мне дали задание вычистить данные из этой ситуации, и я ничего не могу сказать об этом прямо. Я также делюсь своим выводом при запуске кода и проверяемой структуре элементов.
и