Question

Введение

Поскольку я начинаю знакомиться с scrapy, я пытаюсь сканировать некоторые ссылки со случайных веб-страниц.

Проблема

Ссылки, которые я сохраняю в моем файле items.py, написаны без: «https: //», но они мне нужны как гиперссылка.

Поэтому я хочу добавить «https: / / "перед фактическими ссылками, поэтому он отформатирован как гиперссылка.

Мой код

    def parse_target_page(self, response):
        card = response.xpath('//div[@class="text-center artikelbox"]')

        for a in card:
            items = LinkcollectItem()
            link = ('a/@href')
            items ['Title'] = a.xpath('.//h5[@class="title"]/a/text()').get()
            items ['Link'] = a.xpath('.//h5[@class="title"]/a/@href').get()
            yield items

Я попытался вставить свою строку в индекс 0, но это не помогло work

Мой вывод должен выводить все ссылки в виде гиперссылок в csv-файле.

Roman · Answer 1 · 03 августа 2020

если вам нужно добавить только https:// для каждой ссылки, вы можете сделать следующее:

link = a.xpath('.//h5[@class="title"]/a/@href').get()
items ['Link'] =  "https://" + link if link else link

Добавление str к каждому элементу в списке python3

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Добавление str к каждому элементу в списке python3

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы