Deepak Nath 27 февраля 2012 33

Извлечение раздела с веб-страницы с использованием Python

1 Ответ

JKirchartz / 27 февраля 2012

Вы хотите очистить веб-страницу с помощью lxml?попробуйте это:

 from lxml.html import parse
 doc = parse("http://www.ncbi.nlm.nih.gov/pubmedhealth/PMH0001851/").getroot()
 for h2 in doc.cssselect('h2'):
     print h2.text_content()

это откроет захватить h2s со страницы

...