Привет, у меня есть список из 10 веб-сайтов в CSV. Все сайты имеют одинаковый общий формат, включая большую таблицу. Я только хочу данные в 7-х столбцах. Я могу извлечь HTML и фильтровать данные 7-го столбца (через RegEx) на индивидуальной основе, но я не могу понять, как пройти через CSV. Я думаю, что я близко, но мой сценарий не будет работать. Я был бы очень признателен, если бы кто-нибудь помог мне разобраться, как это сделать. Вот что у меня есть:
#Python v2.6.2
import csv
import urllib2
import re
urls = csv.reader(open('list.csv'))
n =0
while n <=10:
for url in urls:
response = urllib2.urlopen(url[n])
html = response.read()
print re.findall('td7.*?td',html)
n +=1