Как я могу получить значение href из ссылки на страницы, чтобы очистить следующую страницу (ы)? - PullRequest
0 голосов
/ 17 февраля 2020

С помощью scrapy-spla sh Я пытаюсь получить доступ к ссылке href для следующих страниц из блока нумерации страниц. Кажется, я не могу найти решение, поэтому любая помощь очень ценится. Извлечение данных с первой страницы работает должным образом.

Чтобы получить ссылку на следующую страницу, которую я пробовал:

        next_page = response.xpath("//ul[@class='pagination center ng-scope']/li[8]/a/@href").get()

        if next_page:
            yield scrapy.Request(url=next_page, callback=self.parse)

Как показывает следующий код, значение href равно href=""

<nav class="paging ng-isolate-scope" data-jn-result-pager="">
<!-- ngIf: totalPages > 1 --><ul class="pagination center ng-scope" data-ng-if="totalPages > 1" style="">
    <li>
        <a href="" data-jn-click="firstPage()" data-ng-class="{'disabled-element':currentPage === 1}" tabindex="0" class="" style="">
            <span class="hidden-md hidden-sm hidden-xs">Første</span>
            <span class="hidden-lg icon icon-arrow-end-left"></span>
        </a>
    </li>
    <li>
        <a href="" data-jn-click="prevPage()" data-ng-class="{'disabled-element':currentPage === 1}" tabindex="0" class="" style="">
            <span class="hidden-md hidden-sm hidden-xs"><span class="icon icon-arrow-left"></span> Forrige</span>
            <span class="hidden-lg icon icon-double-arrow-left"></span>
        </a>
    </li>
    <!-- ngRepeat: index in pagerList --><li data-ng-repeat="index in pagerList" data-ng-class="{'active': index === currentPage}" class="ng-scope" style="">
        <a href="" data-jn-click="goToPage(index)" class="ng-binding" tabindex="0">767</a>
    </li><!-- end ngRepeat: index in pagerList --><li data-ng-repeat="index in pagerList" data-ng-class="{'active': index === currentPage}" class="ng-scope">
        <a href="" data-jn-click="goToPage(index)" class="ng-binding" tabindex="0">768</a>
    </li><!-- end ngRepeat: index in pagerList --><li data-ng-repeat="index in pagerList" data-ng-class="{'active': index === currentPage}" class="ng-scope">
        <a href="" data-jn-click="goToPage(index)" class="ng-binding" tabindex="0">769</a>
    </li><!-- end ngRepeat: index in pagerList --><li data-ng-repeat="index in pagerList" data-ng-class="{'active': index === currentPage}" class="ng-scope active" style="">
        <a href="" data-jn-click="goToPage(index)" class="ng-binding" tabindex="0">770</a>
    </li><!-- end ngRepeat: index in pagerList --><li data-ng-repeat="index in pagerList" data-ng-class="{'active': index === currentPage}" class="ng-scope" style="">
        <a href="" data-jn-click="goToPage(index)" class="ng-binding" tabindex="0">771</a>
    </li><!-- end ngRepeat: index in pagerList -->
    <li>
        <a href="" data-jn-click="nextPage()" data-ng-class="{'disabled-element':currentPage === totalPages}" tabindex="0" class="" style="">
            <span class="hidden-md hidden-sm hidden-xs">Næste <span class="icon icon-arrow-right"></span></span>
            <span class="hidden-lg icon icon-double-arrow-right"></span>
        </a>
    </li>
    <li>
        <a href="" data-jn-click="lastPage()" data-ng-class="{'disabled-element':currentPage === totalPages}" tabindex="0" class="" style="">
            <span class="hidden-md hidden-sm hidden-xs">Sidste</span>
            <span class="hidden-lg icon icon-arrow-end-right"></span>
        </a>
    </li>
</ul><!-- end ngIf: totalPages > 1 -->

сильный текст

...