У меня есть два сценария:
- script 1 : извлекает URL из API живого потока и непрерывно сохраняет их в CSV-файл.
- script 2 : использует pandas для итерации по URL-адресам, извлеченным из живого потока, затем селеному веб-драйверу, чтобы сделать снимок экрана каждого URL-адреса, а затем сохранить каждый снимок экрана с номером руководства.
Поскольку это прямой эфир, новые URL-адреса добавляются в файл "screenshot.csv" каждую минуту.
Хотя сценарий 1 будет запускаться каждую минуту, сценарий 2 будет работать постоянно, но мне нужно, чтобы он делал снимки экрана только с новыми строками, добавленными в столбец «url», а не начинался с начала столбца.
Что мне нужно:
Мне нужно, чтобы цикл итерации начинался с последней строки, в которой он остановился, а не с начала столбца.
Я попробовал приведенный ниже код для script 2 , но он не работает:
df = pd.read_csv('screenshot.csv', header = 0, usecols=['url','guid'])
for index, row in df.iterrows():
r = driver.get(row['url'])
driver.execute_script("window.scrollTo(0,document.body.scrollHeight);")
While True:
file_name = str(row['guid'])
driver.save_screenshot(file_name+ '.png')
i = 0
while i > len (['url']):
print (['url'][i])
i+=1
Не могли бы вы помочь?
Заранее спасибо!