Я хочу добавить дополнительную строку перед URL-адресом, поскольку удаленный URL-адрес неверен, поскольку мне нужно извлечь данные из неверного URL-адреса.
import urllib.request
from bs4 import BeautifulSoup
import re
import sqlite3
def make_soup(url):
thepage = urllib.request.urlopen(url)
soupdata = BeautifulSoup(thepage, "html.parser")
return soupdata
soup = make_soup("https://saturn.etat.lu/tapes/tapes_fr_lst_pdt.jsp?sel=_")
allrecords = soup.findAll('tr')
recordsLength = len(allrecords)
for index in range(3, recordsLength):
record = allrecords[index].find_all('a')
agri= [record[1].get('href')]
for url in agri:
agripage=urllib.request.urlopen(url)
soup1=BeautifulSoup(agripage,"html.parser")
Я получаю следующую ошибку:
unknown url type: 'tapes_fr_nfo_lap.jsp?pdt=1838&lmz=0'