Добавить дополнительную строку перед URL - PullRequest
0 голосов
/ 31 мая 2018

Я хочу добавить дополнительную строку перед URL-адресом, поскольку удаленный URL-адрес неверен, поскольку мне нужно извлечь данные из неверного URL-адреса.

import urllib.request
from bs4 import BeautifulSoup
import re
import sqlite3
def make_soup(url):
    thepage = urllib.request.urlopen(url)
    soupdata = BeautifulSoup(thepage, "html.parser")
    return soupdata
soup = make_soup("https://saturn.etat.lu/tapes/tapes_fr_lst_pdt.jsp?sel=_")
allrecords = soup.findAll('tr')
recordsLength = len(allrecords)
for index in range(3, recordsLength):
    record = allrecords[index].find_all('a')
    agri= [record[1].get('href')]   
    for url in agri:
        agripage=urllib.request.urlopen(url)
        soup1=BeautifulSoup(agripage,"html.parser")

Я получаю следующую ошибку:

unknown url type: 'tapes_fr_nfo_lap.jsp?pdt=1838&lmz=0'        
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...