Question

У меня есть следующая функция

def parseTitle(self,  post):
    """
        Returns title string with spaces replaced by dots
    ""        
    return post.xpath('h2')[0].text.replace('.',  ' ')

Я бы хотел увидеть содержание post. Я перепробовал все, что мог придумать.

Как правильно отладить контент? Это веб-сайт с фильмами, где я разрываю ссылки и заголовок, и эта функция должна анализировать заголовок.

Я уверен, что H @ не существует, как я могу напечатать / отладить это?

mykhal · Answer 1 · 06 мая 2010

post это объект дерева элементов lxml, не так ли? Итак, во-первых, вы можете попробовать:

# import lxml.html # if not yet imported
# (or you can use lxml.etree instead of lxml.html)
print lxml.html.tostring(post)

если нет, вы должны создать объект дерева элементов из него

post = lxml.html.fromstring(post)

или, может быть, проблема в том, что вы должны заменить h2 на //h2?

ваш вопрос не очень понятен ..

Печать содержимого Lxml или Xpath

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Печать содержимого Lxml или Xpath

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы