Ну, если вам это действительно нужно, попробуйте использовать handle_endtag
:
class MyParser(HTMLParser):
def __init__(self, data ):
HTMLParser.__init__(self)
self.data = ""
self.feed(data)
def handle_data(self, data):
self.data = data
def handle_endtag(self, tag, attrs):
print "result -->", self.data
self.data = ""
m = MyParser("""<p>105</p><p></p>""")
Таким образом, каждый раз, когда заканчивается тег, вы будете печатать данные, которые были внутри.Это, однако, будет обрабатывать <p><p></p></p>
как два раза «пустые данные» - перед каждым окончанием тега.Если это близко (но не совсем) к тому, что вам нужно, попробуйте потратить некоторое время на использование также handle_starttag
, чтобы ваш код мог вести себя так, как вы этого хотите.