html5lib отмечает, что его последний выпуск (0.11) несколько устарел. Используя часть Python, у меня есть проблемы рекурсии, как отмечено в Выпуск 70 и Выпуск 59 , но я не могу найти последнюю стабильную версию Mercurial.
Последний совет не подходит, я получил следующую ошибку от python setup.py install
:
byte-compiling build/bdist.linux-x86_64/egg/html5lib/treewalkers/_base.py to _base.pyc
File "build/bdist.linux-x86_64/egg/html5lib/treewalkers/_base.py", line 40
"data": []}
^
SyntaxError: invalid syntax
И я получаю следующие ошибки во время выполнения:
soup = parser.parse(page.read())
File "build/bdist.linux-x86_64/egg/html5lib/html5parser.py", line 165, in parse
File "build/bdist.linux-x86_64/egg/html5lib/html5parser.py", line 144, in _parse
File "build/bdist.linux-x86_64/egg/html5lib/html5parser.py", line 454, in processDoctype
TypeError: insertDoctype() takes exactly 4 arguments (2 given)
Я использую его на Python 2.5.2 с lxml и BeautifulSoup.