скрап, зацикливайся на списке дивов - PullRequest
0 голосов
/ 27 декабря 2018

Я использую scrapy и хотел бы получить все теги (с текстом), хранящиеся в списке, и просмотреть этот список, чтобы получить то, что я хочу.

Ниже своего кода я сохранил все теги, которые я хочу, в div, это нормально, но цикл после не работает.ошибка: (объект 'str' не имеет атрибута 'css')

def parse_0(self, response):
    divs = response.css('div.resultList.mB15.hiddenOverflow.listing').extract()

    for div in divs:
        yield {
            'prix': str(div.css('div.fieldPrice ::text').extract_first()).replace("\\xa0", "").replace("\u20ac", ""),
            'lien': div.xpath('.//a/@href').extract_first(),
            'date_scrap': time.strftime("%d/%m/%Y"),
        }

здесь изображение, представляющее встроенный div: введите описание изображения здесь спасибо

Ответы [ 2 ]

0 голосов
/ 27 декабря 2018

divs = response.css('div.resultList.mB15.hiddenOverflow.listing').extract() здесь, когда вы используете извлечение, он вернет вам список селекторов, преобразованных в строку.если вы хотите продолжать использовать extract(), то конвертируйте div в selector, в противном случае вы можете пропустить извлечение (), и код должен работать нормально.

Спасибо.

0 голосов
/ 27 декабря 2018

Не звоните extract() на селекторе.extract() возвращает стр.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...