Я использую селекторы scrapy и пытаюсь извлечь элемент "1" из объявления HTML ниже:
<li aria-label="Pagina" class="page active"><a href="#">1</a></li>
У меня есть два одинаковых объявления во всем исходном HTML-контенте.
<div class="row paging-bar">
<ul class="sync-pagination pagination pull-right">
<li aria-label="Pagina" class="prev"><a href="#"><</a></li>
<li aria-label="Pagina" class="page active"><a href="#">1</a></li>
<li aria-label="Pagina" class="page"><a href="#">2</a></li>
<li aria-label="Pagina" class="page"><a href="#">3</a></li>
<li aria-label="Pagina" class="page"><a href="#">4</a></li>
<li aria-label="Pagina" class="page"><a href="#">5</a></li>
<li aria-label="Pagina" class="page"><a href="#">6</a></li>
<li><span>...</span></li>
<li aria-label="Pagina" class="page"><a href="#">1405</a></li>
<li aria-label="Pagina" class="next"><a href="#">></a></li>
</ul>
</div>
<div class="row paging-bar">
<ul class="sync-pagination pagination pull-right">
<li aria-label="Pagina" class="prev"><a href="#"><</a></li>
<li aria-label="Pagina" class="page active"><a href="#">1</a></li>
<li aria-label="Pagina" class="page"><a href="#">2</a></li>
<li aria-label="Pagina" class="page"><a href="#">3</a></li>
<li aria-label="Pagina" class="page"><a href="#">4</a></li>
<li aria-label="Pagina" class="page"><a href="#">5</a></li>
<li aria-label="Pagina" class="page"><a href="#">6</a></li>
<li><span>...</span></li>
<li aria-label="Pagina" class="page"><a href="#">1405</a></li>
<li aria-label="Pagina" class="next"><a href="#">></a></li>
</ul>
</div></div>
Я попробовал команду:
response.xpath("normalize-space(//li[@class='page active']/a[@href]/text())").extract_first()
но вернулась пустая строка.