У меня есть такой div:
<div class="widget-archive-monthly widget-archive widget"> <h3 class="widget-header">Monthly <a href="http://myblog.com/blogs/my_name/archives.html">Archives</a></h3> <div class="widget-content"> <ul> <li><a href="http://myblog.com/blogs/my_name/2010/10/">October 2010</a></li> <li><a href="http://myblog.com/blogs/my_name/2010/09/">September 2010</a></li> <li><a href="http://myblog.com/blogs/my_name/2010/08/">August 2010</a></li> <li><a href="http://myblog.com/blogs/my_name/2010/07/">July 2010</a></li> <li><a href="http://myblog.com/blogs/my_name/2010/06/">June 2010</a></li> <li><a href="http://myblog.com/blogs/my_name/2010/05/">May 2010</a></li> <li><a href="http://myblog.com/blogs/my_name/2010/04/">April 2010</a></li> <li><a href="http://myblog.com/blogs/my_name/2010/03/">March 2010</a></li> <li><a href="http://myblog.com/blogs/my_name/2010/02/">February 2010</a></li> <li><a href="http://myblog.com/blogs/my_name/2010/01/">January 2010</a></li> <li><a href="http://myblog.com/blogs/my_name/2009/12/">December 2009</a></li> <li><a href="http://myblog.com/blogs/my_name/2009/11/">November 2009</a></li> <li><a href="http://myblog.com/blogs/my_name/2009/10/">October 2009</a></li> <li><a href="http://myblog.com/blogs/my_name/2009/09/">September 2009</a></li> <li><a href="http://myblog.com/blogs/my_name/2009/08/">August 2009</a></li> <li><a href="http://myblog.com/blogs/my_name/2009/07/">July 2009</a></li> <li><a href="http://myblog.com/blogs/my_name/2009/06/">June 2009</a></li> <li><a href="http://myblog.com/blogs/my_name/2009/05/">May 2009</a></li> <li><a href="http://myblog.com/blogs/my_name/2009/04/">April 2009</a></li> <li><a href="http://myblog.com/blogs/my_name/2009/03/">March 2009</a></li> <li><a href="http://myblog.com/blogs/my_name/2009/02/">February 2009</a></li> </ul> </div> </div>
Я пытаюсь получить значения href внутри widget-content div.
widget-content
Как бы я нацелил эти ссылки, используя xpath, и проигнорировал бы любую другую ссылку на странице, такую как ссылка на «Архивы», чтобы я в итоге получил только эти значения:
http://myblog.com/blogs/my_name/2010/10/ http://myblog.com/blogs/my_name/2010/09/ http://myblog.com/blogs/my_name/2010/08/ http://myblog.com/blogs/my_name/2010/07/ ... etc ...
//div[@class="widget-content"]//a/@href
Это должно дать вам href-значения ссылок ТОЛЬКО внутри widget-content DIV.
относительный ответ = XPath: найти URL ссылки по тексту ссылки
"//a/@href"