использование HTMLparser для нескольких вызовов - PullRequest
1 голос
/ 23 ноября 2011

Я создаю свой собственный синтаксический анализатор, который не использует API поисковой системы и возвращает только URL с результатами поиска в среде bing, используя python.

Я создал обычный класс HTMLParser и вmain я создал экземпляр класса

parser = MyHTMLParser()
parser.feed(content)

Это работает для отдельных вызовов, но если я изменю содержимое и помещу это в цикл, канал не будет работать.

Любая помощь будетбыть оцененным.

1 Ответ

2 голосов
/ 23 ноября 2011

Перед тем как передать экземпляру синтаксического анализатора новый документ, вы должны сбросить его.

Например parser.reset()

См .: http://docs.python.org/library/htmlparser.html

...