Я пытаюсь написать сценарий для проверки существования веб-страницы, было бы неплохо, если бы он проверял без загрузки всей страницы.
Это моя отправная точка, яв нескольких примерах использование httplib одинаково, однако каждый проверяемый сайт просто возвращает false.
import httplib
from httplib import HTTP
from urlparse import urlparse
def checkUrl(url):
p = urlparse(url)
h = HTTP(p[1])
h.putrequest('HEAD', p[2])
h.endheaders()
return h.getreply()[0] == httplib.OK
if __name__=="__main__":
print checkUrl("http://www.stackoverflow.com") # True
print checkUrl("http://stackoverflow.com/notarealpage.html") # False
Есть идеи?
Редактировать
Кто-то предложил это, ноих сообщение было удалено .. urllib2 избегает загрузки всей страницы?
import urllib2
try:
urllib2.urlopen(some_url)
return True
except urllib2.URLError:
return False