Xpath для поиска текста внутри тега привязки с помощью класса (Scrapy) - PullRequest
0 голосов
/ 01 марта 2019

Я пытаюсь извлечь ссылку из тега привязки, используя Xpath

URL

<a class="text size-1x-small font-accent color-brand all-caps"
   href="http://time.com/section/business" 
   data-reactid="199">
       Business
</a>

Код

item["category"] = str(
    response.xpath(
        '//a[@class="text size-1x-small font-accent color-brand all-caps"]/text()'
    ).extract()
    )

И функцию python

def parseSave(self, response):
    item = NYtimesItem()
    item["category"] = response.xpath(
        '//a[@class="text size-1x-small font-accent color-brand all-caps"]/text()'
    ).extract()

    yield item

Пожалуйста, скажите мне, что я делаю неправильно. Ожидаемым выводом будет текст Anchor Tag.например, Бизнес

1 Ответ

0 голосов
/ 02 марта 2019

/text() предназначен для получения внутреннего текста элемента.Чтобы извлечь атрибут href, используйте /@href.

Вот удобная таблица xpath

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...