Я знаю, что подобные вопросы были опубликованы ранее, но я не нашел что-то подходящее для этого случая. Я надеюсь, что вы можете помочь.
Вот краткое изложение проблемы:
- Я пишу код веб-очистки с использованием селена (для назначения)
- В коде используется цикл for для перехода с одной страницы на другую
- Вывод кода представляет собой информационный кадр с каждого номера страницы, который импортируется в Excel. (в основном таблица)
- Кадры данных со всех веб-страниц, которые должны быть записаны только на одном листе Excel (не несколько листов в файле Excel)
- Каждая веб-страница имеет одинаковый формат данных (т.е. количество столбцов и заголовков столбцов одинаковы, но значения строк различаются ..)
- Для информации, я использую панд, поскольку она помогает преобразовать вывод с веб-сайта в excel
Проблема, с которой я сталкиваюсь, заключается в том, что когда кадр данных экспортируется в Excel, он перезаписывает данные предыдущей итерации. следовательно, когда я выполню код и очистка будет завершена, я получу данные только из последней итерации цикла.
Пожалуйста, посоветуйте строки кодирования, которые мне нужно добавить, чтобы всеитерациями, которые будут записаны в листе Excel, другими словами и, более конкретно, каждая итерация должна экспортировать данные в Excel, начиная с первой пустой строки.
Вот выдержка из кода:
for i in range(50, 60):
url= (urlA + str(i)) #this is the url generator, URLA is the main link excluding pagination
driver.get(url)
time.sleep(random.randint(3,7))
text=driver.find_element_by_xpath('/html/body/pre').text
data=pd.DataFrame(eval(text))
export_excel = data.to_excel(xlpath)