Я пытаюсь создать файл CSV со списком URL-адресов.
Я довольно новичок в программировании, поэтому прошу прощения за любой неаккуратный код.
У меня есть цикл, который проходит черезсписок мест, где можно получить список URL.
У меня есть цикл в этом цикле, который экспортирует данные в файл CSV.
import urllib, csv, re
from BeautifulSoup import BeautifulSoup
list_of_URLs = csv.reader(open("file_location_for_URLs_to_parse"))
for row in list_of_URLs:
row_string = "".join(row)
file = urllib.urlopen(row_string)
page_HTML = file.read()
soup = BeautifulSoup(page_HTML) # parsing HTML
Thumbnail_image = soup.findAll("div", {"class": "remositorythumbnail"})
Thumbnail_image_string = str(Thumbnail_image)
soup_3 = BeautifulSoup(Thumbnail_image_string)
Thumbnail_image_URL = soup_3.findAll('a', attrs={'href': re.compile("^http://")})
Это частьэто не работает для меня:
out = csv.writer(open("file_location", "wb"), delimiter=";")
for tag in soup_3.findAll('a', href=True):
out.writerow(tag['href'])
По сути, писатель продолжает писать поверх себя, есть ли способ перейти к первой пустой строке в CSV и начать писать