проверка Python HTML действителен - PullRequest
1 голос
/ 03 сентября 2010

Как я могу проверить действительный HTML-код с Python? Мне нужна проверка закрытых тегов и фигурные скобки в параметрах тегов. Такие как | a href = "xxx '| и другие возможные проверки, какие библиотеки я могу использовать для этого?

1 Ответ

3 голосов
/ 05 сентября 2010

Ну, это не совсем то, что вы ищете, но чтобы проверить HTML для веб-сайта, над которым я работаю, я прошу W3C Validator проверить его для меня, и я просто проверяю вывод на экран, чтобыосновной результат да / нет.Обратите внимание, что в Интернете есть несколько сервисов проверки в качестве альтернативы, но W3C работает достаточно хорошо для меня.

#!/usr/bin/python2.6
import re
import urllib
import urllib2

def validate(URL):
    validatorURL = "http://validator.w3.org/check?uri=" + \
        urllib.quote_plus(URL)
    opener = urllib2.urlopen(validatorURL)
    output = opener.read()
    opener.close()
    if re.search("This document was successfully checked as".replace(
            " ", r"\s+"), output):
        print "    VALID: ", URL
    else:
        print "INVALID: ", URL
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...