JSON кажется подходящим инструментом для работы.XML и SQL немного сложны для простой функциональности, которая вам нужна.Кроме того, Python имеет встроенную функцию чтения / записи json (json достаточно похож на Python dict
во многих отношениях).
Просто ведите список сайтов, которые вы хотите использовать, в файле jsonаналогично этому (поместите его в файл с именем test.json
):
{
"sites": ["www.google.com",
"www.facebook.com",
"www.example.com"]
}
Затем выполните очистку для каждого из следующих сайтов:
import json
with open('test.json') as my_json:
json_dict = json.load(my_json)
for website in json_dict["sites"]:
print("About to scrape: ", website)
# do scraping
page_link = website
...
это выдаст (если вы удалите...
):
About to scrape: www.google.com
About to scrape: www.facebook.com
About to scrape: www.example.com
Просто поместите оставшуюся логику, которую вы хотите использовать, чтобы выполнить очистку (как у вас выше в вопросе) в # do scraping
комментарий.