Сначала я пытаюсь очистить td
, который содержит названия различных заданий (со ссылками). И я хочу сохранить данные, которые я снова вычеркну из этих ссылок 'td' (данные этих соответствующих заданий с их веб-страницы) в разных текстовых файлах. Я хочу, чтобы очищенные данные сохранялись отдельно для каждой веб-страницы в разных текстовых файлах. Могу ли я сделать это? Пожалуйста, поделитесь своей идеей, если вы знаете что-нибудь об этом !!
import requests
from bs4 import BeautifulSoup
main = "https://deltaimmigration.com.au/Australia-jobs/"
def First():
r = requests.get(main)
soup = BeautifulSoup(r.text, 'html5lib')
links = []
with open("links.txt", 'w', newline="", encoding="UTF-8") as f:
for item in soup.findAll("td", {'width': '250'}):
item = item.contents[1].get("href")[3:]
item = f"https://deltaimmigration.com.au/{item}"
f.write(item+"\n")
links.append(item)
print(f"We Have Collected {len(links)} urls")
return links
def Second():
links = First()
with requests.Session() as req:
for link in links:
print(f"Extracting {link}")
r = req.get(link,timeout = 100)
soup = BeautifulSoup(r.text, 'html5lib')
for item in soup.findAll("table", {'width': '900'}):
return item
def Third():
r = requests.get(main)
soup = BeautifulSoup(r.text, 'html5lib')
result = Second()
for item in soup.findAll("td", {'width': '250'}):
with open(item.text + '.txt', 'w', newline="", encoding="UTF-8") as f:
f.write('result')
Third()
Я пытался со следующим:
with open(item.text + '.txt', 'w', newline="", encoding="UTF-8") as f:
, но я получаю ошибку как
File "e:/test/check.py", line 10, in Third with open(item.text + '.txt', 'w', newline="", encoding="UTF-8") as f: FileNotFoundError: [Errno 2] No such file or directory: ' Vegetable Grower (Aus)/market Gardener (NZ).txt'"