Ну, это не совсем то, что вы ищете, но чтобы проверить HTML для веб-сайта, над которым я работаю, я прошу W3C Validator проверить его для меня, и я просто проверяю вывод на экран, чтобыосновной результат да / нет.Обратите внимание, что в Интернете есть несколько сервисов проверки в качестве альтернативы, но W3C работает достаточно хорошо для меня.
#!/usr/bin/python2.6
import re
import urllib
import urllib2
def validate(URL):
validatorURL = "http://validator.w3.org/check?uri=" + \
urllib.quote_plus(URL)
opener = urllib2.urlopen(validatorURL)
output = opener.read()
opener.close()
if re.search("This document was successfully checked as".replace(
" ", r"\s+"), output):
print " VALID: ", URL
else:
print "INVALID: ", URL