Я пытаюсь собрать данные с веб-сайта Центрального банка Мексики, но попал в стену.Что касается действий, мне нужно сначала получить доступ к ссылке в начальном URL.Как только ссылка будет доступна, мне нужно выбрать 2 раскрывающихся значения и нажать кнопку «Отправить».Если все пойдет хорошо, я перейду на новый URL, где доступен набор ссылок на PDF-файлы.
Исходный URL-адрес:
"http://www.banxico.org.mx/mercados/valores-gubernamentales-secto.html"
Вложенный URL-адрес (с раскрывающимся списком):" http://www.banxico.org.mx/valores/LeePeriodoSectorizacionValores.faces?BMXC_claseIns=GUB&BMXC_lang=es_MX"
входные данные (произвольные), скажем, '07 / 03/2019 'и '14 / 03/2019'. * 10101 *
Используя BeautifulSoup и запросы, я чувствую, что дошел до заполнения значений в раскрывающемся списке, ноне удалось нажать кнопку и получить окончательный URL со списком ссылок.
Ниже приведен мой код:
from bs4 import BeautifulSoup
import requests
pagem=requests.get("http://www.banxico.org.mx/mercados/valores-gubernamentales-secto.html")
soupm = BeautifulSoup(pagem.content,"lxml")
lst=soupm.find_all('a', href=True)
url=lst[-1]['href']
page = requests.get(url)
soup = BeautifulSoup(page.content,"lxml")
xin= soup.find("select",{"id":"_id0:selectOneFechaIni"})
xfn= soup.find("select",{"id":"_id0:selectOneFechaFin"})
ino=list(xin.stripped_strings)
fino=list(xfn.stripped_strings)
headers = {'Referer': url}
data = {'_id0:selectOneFechaIni':'07/03/2019', '_id0:selectOneFechaFin':'14/03/2019',"_id0:accion":"_id0:accion"}
respo=requests.post(url,data,headers=headers)
print(respo.url)
В коде respo.url равен url ... код завершается ошибкой.Кто-нибудь может помочь мне определить, где проблема?Я новичок в расчистке, так что это может быть очевидно - заранее извиняюсь за это ... Буду признателен за любую помощь.Спасибо!