Как получить все загрузки с веб-сайта и повторить все параметры и загрузить каждый вариант с Python и Selenium - PullRequest
0 голосов
/ 07 февраля 2020

Таким образом, у меня есть веб-сайт, который позволяет мне выбирать параметры на веб-сайте. Мне нужно go войти и загрузить все файлы .csv и .txt, которые существуют на сайте. Я обычно знаю параметры, но мне нужно, чтобы все файлы загружались. Мне также нужно, чтобы он был динамически c и проверял, когда новые файлы станут доступными. Для сайта нет API, поэтому я использую Selenium и Python для автоматизации загрузки с сайта. Мне удалось получить файл для загрузки. Тем не менее, я хотел бы перебрать опцию по всем индексам из выпадающего меню. См. Изображение ниже:

enter image description here

Я знаю идентификатор и XPATH для него как XPATH = //*[@id='reportingAdminCode'] Это поле для администратора отчетов. Поле Report всегда фиксируется следующим образом:

          # Student Data File (Complete) Index 4 NEEDED FOR REPORT XPATH = //*[@id='reportTypeSelected']/option[5]
          element = WebDriverWait(browser, 20).until(EC.element_to_be_clickable((By.XPATH, "//*[@id='reportTypeSelected']/option[5]")))
          element.click();
          time.sleep(3)

Когда я нажимаю кнопку «Поиск» на основе критериев, имена всегда отличаются, за исключением года в названии имени и определенных имен схемы, которые не кажутся постоянными. Кроме того, также кажется, что есть несколько окончательных версий. Поэтому я действительно пытаюсь придумать процесс, который будет загружать их все сразу, а затем сжать их и сжать при следующей загрузке. Вроде как ротация логов в Linux, но для загрузки всех файлов одновременно. Когда параметры поиска заполнены правильно, я получаю следующую возможность выбрать что-то:

Пример enter image description here

Что можно сделать, чтобы получить все загрузки одновременно? Вы можете найти исходную страницу html здесь: ссылка

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...