В моем веб-браузере есть следующий код:
postbody = {'Submit': {}, 'czas_kon2': '', 'czas_pocz2': '', 'num_pacz': '', 'typ': 'wsz'}
post = requests.post(spolka, data=postbody)
data = post.text
Я выполняю его более 400 веб-страниц в цикле, чтобы очистить данные с помощью многопроцессорной обработки (8 процессов). data
должен содержать целую HTML-страницу для дальнейшей обработки XML. Но из 400 страниц я получаю 2, которые не возвращают значимое содержание. Я подозреваю, что это из-за большой нагрузки, которую я создаю. Я попытался time.sleep(1), time.sleep(10)
, но не повезло.
Как я могу гарантировать, что переменная data
или post
всегда будет содержать целую страницу, как для 398 рабочих?
Я пробовал просто, покацикл для повторения ... но он далек от совершенства (мне удалось получить 1 из оставшихся 2 страниц) после одной дополнительной попытки.
while len(data) < 1024:
postbody = {'Submit': {}, 'czas_kon2': '', 'czas_pocz2': '', 'num_pacz': '', 'typ': 'wsz'}
post = requests.post(spolka, data=postbody)
data = post.text