Я пытаюсь использовать xPath для обхода кода газеты (для практики), сейчас я хотел бы получить основную статью, ее изображение и небольшое описание, которое я получаю. Но я пока не очень разбираюсь в xPath и не могу найти небольшое описание.
с этим кодом:
<div class="margenesPortlet">
<div class="fondoprincipal">
<div class="margenesPortlet">
<a href='notas/n1092329.htm' ><img id="LinkNotaA1_Foto" src="http://i.oem.com.mx/5cfaf266-bb93-436c-82bc-b60a78d21fb6.jpg" height="250" width="300" border="0" /></a>
<div class="piefoto_esto">Un tubo de 12 pulgadas al lado de la Vialidad Sacramento que provocó el corte del servicio durante toda la mañana y hasta alrededor de las cuatro de la tarde. Foto: El Heraldo de Chihuahua</div>
<div class="cabezaprincesto"><a href='notas/n1092329.htm' class='cabezaprincesto' >Sin agua 8 mil usuarios</a></div>
<div class="resumenesto"><a href='notas/n1092329.htm' class='resumenesto' >La ruptura de una línea en el tanque de rebombeo de agua Sacramento dejó sin servicio a ocho mil usuarios, en once colonias del sur de la ciudad. </a></div>
</div>
</div>
</div>
Я хочу получить картинку (с подписью или без), а затем название статьи. Эти 3 вещи, которые я могу получить, используя:
// div [@ class = 'fondoprincipal'] <- дает мне основное изображение и подпись </p>
// a [@ class = 'cabezaprincesto'] / text () <- дает мне название статьи </p>
но я не могу достать небольшое описание, которое является div с class = "resumenesto", я не пытался получить что-либо по этому идентификатору, потому что один и тот же идентификатор используется снова и снова в остальной части HTML так что он возвращает много дополнительных предметов.
Как я могу получить этот конкретный? а потом кто-нибудь из вас порекомендует мне хороший способ разбора его на другой веб-странице? Я подумал, может быть, PHP пишет какой-то HTML, используя эти значения, но я не совсем уверен ...
Редактировать
Что я имею в виду под "этим конкретным", как я могу получить этот div class = "resumenesto", тот, который находится внутри div class = "fondoprincipal" ...
Редактировать 2
Спасибо, теперь xPath Traversing стал более понятным. Но что касается моего второго вопроса, может ли кто-нибудь из вас порекомендовать мне хороший способ разбора его на другой веб-странице? Я подумал, может быть, PHP пишет какой-то HTML, используя эти значения, но я не уверен, действительно ...