У меня проблемы с загрузкой txt-файла с этой страницы: https://www.ceps.cz/en/all-data#RegulationEnergy (когда вы прокручиваете страницу вниз и видите Download: txt, xls и xml).
Моя цель - создать скребок, который будет переходить на связанную страницу, например, нажимать на ссылку txt и сохранять загруженный файл.
Основные проблемы, которые я не знаю, как решить:
В файле нет реальной ссылки, по которой я могу позвонить и загрузить ее, но ссылка создается с помощью JS на основе фильтров и типа файла.
Когда я использую библиотеку requests
для python и вызываю ссылку со всеми заголовками, она просто перенаправляет меня на https://www.ceps.cz/en/all-data.
Подходы пробовали:
Использование скребка, такого как ParseHub, для загрузки ссылки не работает должным образом. Но этот скребок был ближе всего к тому, что я хотел получить.
Использовал библиотеку requests
для подключения к ссылке, используя заголовки, которые HXR-запрос использует для загрузки файла, но он просто перенаправляет меня на https://www.ceps.cz/en/all-data.
Если вы могли бы предложить какое-то решение для этой задачи, заранее спасибо. : -)