Я новичок ie пытаюсь извлечь файлы с этой веб-страницы http://www.cnmv.es/ipps/ (информация об испанских sh компаниях)
Проблема в том, что мне нужно заполнить сначала несколько полей (компания, семестр, год), а затем нажмите на загрузку. Используя браузер, он начинает загрузку файла .zip, который содержит один или несколько файлов .xbrl, но я не могу найти способ сделать это в python через запросы или аналогичные (в кнопке загрузки нет URL-адреса ), получая содержимое файла в переменной и сохраняя файл по пути.
То, что я пробовал, - это то, что я мог найти в Интернете о похожих проблемах, я читал кое-что о ajax, json, beautifulsoup ... но безрезультатно. Мой настоящий сценарий неверен, потому что единственное, что я получаю, это ответ, но не целевой файл, и мне нужна ваша помощь, пожалуйста.
Здесь вы можете найти черновик того, что я имею в виду, это похоже на мой настоящий сценарий.
from requests import Session
s = Session()
Company = [''] #Companies string array
Semester = [''] #Semester string array
Year = [''] #Years string array
for x in range(Company):
for y in range(Semester):
for z in range(Year):
#request the data and receive the desired information
response = s.post(
url='http://www.cnmv.es/ipps/',
data = {
'wDescargas$drpEntidades': Company[x], #search parameters
'wDescargas$drpPeriodos': Semester[y],
'wDescargas$drpEjercicios': Year[z])
},
headers={
'Referer': 'http://www.cnmv.es/ipps/',
}
)
#save the content of the target file in a path
data = response.content
filename = Semester[y] + Company[x] + Year[z]
with open(filename,'w+b') as s:
s.write(data)
Большое спасибо за вашу помощь.