С этого URL: http://vs -web-fs-1.oecd.org / piaac / puf-data / CSV
Я хочу скачать все файлы и сохранить ихс текстом тега привязки.Я предполагаю, что моя главная задача - получить текст тега привязки прямо сейчас:
from bs4 import BeautifulSoup import requests import urllib.request url_base = "http://vs-web-fs-1.oecd.org" url_dir = "http://vs-web-fs-1.oecd.org/piaac/puf-data/CSV" r = requests.get(url_dir) data = r.text soup = BeautifulSoup(data,features="html5lib") for link in soup.find_all('a'): if link.get('href').endswith(".csv"): print(link.find("a")) urllib.request.urlretrieve(url_base+link.get('href'), "test.csv")
Строка print(link.find("a")) возвращает None.Как я могу получить текст?
print(link.find("a"))
None
Вы получаете текст, обращающийся к содержимому , например:
link.contents[0]
или
link.string