Исходя из того, что написал @tauran, вы, вероятно, захотите сделать что-то вроде этого:
from HTMLParser import HTMLParser
class MyHTMLParser(HTMLParser):
def print_p_contents(self, html):
self.tag_stack = []
self.feed(html)
def handle_starttag(self, tag, attrs):
self.tag_stack.append(tag.lower())
def handle_endtag(self, tag):
self.tag_stack.pop()
def handle_data(self, data):
if self.tag_stack[-1] == 'p':
print data
p = MyHTMLParser()
p.print_p_contents('<p>test</p>')
Теперь вы можете поместить все содержимое <p>
в список и вернуть его в результате иличто-то еще в этом роде.
TIL: при работе с такими библиотеками нужно думать о стеках !