Question

Мне нужно получить контент для этого XPath:

/html/body/div/table[2]/tbody/tr/td[2]

Это скопировано с FireBug. Как я могу это сделать? У меня очень большой HTML-документ, поэтому я не хочу (и не знаю, как :)), чтобы получить его Спасибо.

Tomasz Elendt · Answer 1 · 24 декабря 2010

lxml может обрабатывать html (и обеспечивает довольно хорошую поддержку xpath):

>>> import lxml.html
>>> tree = lxml.html.parse('test.html')
>>> for node in tree.xpath('/html/body/div/table[2]/tbody/tr/td[2]'):
...     print node.text
...          
first row, second column
second row, second column

Просто убедитесь, что вы используете html-парсер .

andriyko · Answer 2 · 24 декабря 2010

import lxml.html as h
tree = h.parse("keys_results.html")
text = tree.xpath("string(//*[contains(text(),'needed_text')])")
print text

Какой самый простой способ получить содержимое элемента с помощью XPath с Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Какой самый простой способ получить содержимое элемента с помощью XPath с Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов