Печать содержимого Lxml или Xpath - PullRequest
1 голос
/ 04 марта 2010

У меня есть следующая функция

def parseTitle(self,  post):
    """
        Returns title string with spaces replaced by dots
    ""        
    return post.xpath('h2')[0].text.replace('.',  ' ')

Я бы хотел увидеть содержание post. Я перепробовал все, что мог придумать.

Как правильно отладить контент? Это веб-сайт с фильмами, где я разрываю ссылки и заголовок, и эта функция должна анализировать заголовок.

Я уверен, что H @ не существует, как я могу напечатать / отладить это?

1 Ответ

2 голосов
/ 06 мая 2010

post это объект дерева элементов lxml, не так ли? Итак, во-первых, вы можете попробовать:

# import lxml.html # if not yet imported
# (or you can use lxml.etree instead of lxml.html)
print lxml.html.tostring(post)

если нет, вы должны создать объект дерева элементов из него

post = lxml.html.fromstring(post)

или, может быть, проблема в том, что вы должны заменить h2 на //h2?

ваш вопрос не очень понятен ..

...