Я создал скрипт, использующий Python для анализа названий фильмов и их лет, распределенных по нескольким страницам с торрент-сайта, и записи их в файл CSV.Он работает без ошибок и записывает данные в CSV-файл без каких-либо проблем.
Я сделал все это без использования этой самой строки return itemlist
в моей функции get_data()
и при создании этой функции write_data()
полностью независим, поэтому я записал данные в CSV-файл, взятый из этого списка itemlist
, расположенный под переменной URLS
.
Если я сохраню существующий дизайн без изменений, необходимо ли использовать именно эту строкуreturn itemlist
что закомментировано сейчас?Если так, то почему?
import requests
from bs4 import BeautifulSoup
import csv
URLS = ["https://yts.am/browse-movies?page={}".format(page) for page in range(1,6)]
itemlist = []
def get_data(links):
for url in links:
res = requests.get(url)
soup = BeautifulSoup(res.text,"lxml")
for record in soup.select('.browse-movie-bottom'):
items = {}
items["Name"] = record.select_one('.browse-movie-title').text
items["Year"] = record.select_one('.browse-movie-year').text
itemlist.append(items)
# return itemlist
def write_data():
with open("outputfile.csv","w", newline="") as f:
writer = csv.DictWriter(f,['Name','Year'])
writer.writeheader()
for data in itemlist:
writer.writerow(data)
if __name__ == '__main__':
get_data(URLS)
write_data()