Какой самый простой способ получить содержимое элемента с помощью XPath с Python? - PullRequest
0 голосов
/ 24 декабря 2010

Мне нужно получить контент для этого XPath:

/html/body/div/table[2]/tbody/tr/td[2]

Это скопировано с FireBug. Как я могу это сделать? У меня очень большой HTML-документ, поэтому я не хочу (и не знаю, как :)), чтобы получить его Спасибо.

Ответы [ 2 ]

1 голос
/ 24 декабря 2010

lxml может обрабатывать html (и обеспечивает довольно хорошую поддержку xpath):

>>> import lxml.html
>>> tree = lxml.html.parse('test.html')
>>> for node in tree.xpath('/html/body/div/table[2]/tbody/tr/td[2]'):
...     print node.text
...          
first row, second column
second row, second column

Просто убедитесь, что вы используете html-парсер .

0 голосов
/ 24 декабря 2010
import lxml.html as h
tree = h.parse("keys_results.html")
text = tree.xpath("string(//*[contains(text(),'needed_text')])")
print text
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...