Я работаю с python 3.7 и ОС - Windows 10 pro.
У меня есть такие URL:
http://example.com/[text, image, table]/[0001-8000].pdf
Я пытаюсь сформировать таблицу, которая выглядела бы как
1 - текст
2 - Изображение
3 - Текст
4 - Таблица
5 - Изображение
и т.д..
Я пытался использовать http.client, urlopen из urllib.request, запросы и т.д.
Один пример:
import requests
baseURL = 'http://example.com/'
type = ['text', 'image', 'table']
for fN in range (8000):
for tp in type:
workURL = baseURL + tp + '/' + str(fN + 1).zfill(4) + '.pdf'
if requests.head(workURL, timeout = 0.0001).status_code == 200:
"write fN + 1 and tp values to a csv file before proceeding to the next loop with next fN."
break
Нет вывода. Просто "зависает" на if requests.head(workURL, timeout = 0.0001).status_code == 200: