Мне нужно получить контент для этого XPath:
/html/body/div/table[2]/tbody/tr/td[2]
Это скопировано с FireBug. Как я могу это сделать? У меня очень большой HTML-документ, поэтому я не хочу (и не знаю, как :)), чтобы получить его Спасибо.
lxml может обрабатывать html (и обеспечивает довольно хорошую поддержку xpath):
>>> import lxml.html >>> tree = lxml.html.parse('test.html') >>> for node in tree.xpath('/html/body/div/table[2]/tbody/tr/td[2]'): ... print node.text ... first row, second column second row, second column
Просто убедитесь, что вы используете html-парсер .
import lxml.html as h tree = h.parse("keys_results.html") text = tree.xpath("string(//*[contains(text(),'needed_text')])") print text