Я пытаюсь загрузить отчеты с веб-сайта компании, https://www.investorab.com/investors-media/reports-presentations/. В конце концов, я хотел бы загрузить все доступные отчеты.
У меня почти нет опыта работы с веб-браузером, поэтому у меня возникают некоторые проблемы с определением правильного шаблона поиска. Раньше мне нужно было удалить все ссылки, содержащие файлы PDF, т.е. я мог использовать soup.select ('div [id = "id-name"] a [data-type = "PDF"]'). Но для этого веб-сайта не указан тип данных для ссылок. Как выбрать все ссылки в разделе «Отчет и презентации»? Вот то, что я пробовал, но он возвращает пустой список:
from bs4 import BeautifulSoup
import requests
url = "https://www.investorab.com/investors-media/reports-presentations/"
response = requests.get(url)
soup = BeautifulSoup(response.text, 'lxml')
# Select all reports, publication_dates
reports = soup.select('div[class="html not-front not-logged-in no-sidebars page-events-archive i18n-en"] a[href]')
pub_dates = soup.select('div[class="html not-front not-logged-in no-sidebars page-events-archive i18n-en"] div[class="field-content"]')
Я также хотел бы выбрать дату всех публикаций, но в итоге получается пустой список. Приветствуется любая помощь в правильном направлении.