Я использую селен с драйвером Firefox (geckodriver), чтобы получить какой-либо источник страницы из списка URL-адресов.
Я заметил, что если интернет работает медленно, FireFox не ждет, пока страница полностью загрузится (выполнение не ожидает в строке 5). В результате источник page_source в строке 9 фактически взят из предыдущего URL.
Как я могу заставить Firefox ждать полной загрузки страницы?
Селен: 3.14.1
Geckodriver: 0.23.0 linux64
1 browser = webdriver.Firefox()
2
3 for url in url_list:
4
5 browser.get(url)
6
7 sleep(1)
8
9 page_source = browser.page_source
10
11 if html == page_source:
12
13 print "error: page not fully loaded"
14
15 exit(1)
16 html = page_source
Обновление: я протестировал с драйвером Chrome. Драйвер Chrome ожидает полной загрузки страницы. Так что, возможно, проблема в драйвере FireFox.