Как извлечь раздел через xpath из исходного кода в scrapy? - PullRequest
0 голосов
/ 10 февраля 2019

Я пытаюсь извлечь текст из исходного кода сайта в разделе.

Исходный код сайта, который я пытаюсь извлечь, выглядит следующим образом:

if ('function' === typeof window.ToggleFilters) {
    window.ToggleFilters();
}
</script>

<main id="main" data-danger="">

<section data-creation-date="2018-10-15 11:35:06">

    <div class="detail__content">

Я попытался через response.css и response.xpath, чтобы попытаться получить данные из исходного кода безуспешно через оболочку scrapy.

response.xpath("//*[contains('data-creation')]")

Я хотел бы извлечь только дату создания данныхтак это будет выглядеть как

'2018-10-15 11:35:06'

1 Ответ

0 голосов
/ 10 февраля 2019
response.css('#main section::attr("data-creation-date")').extract_first()

или

response.xpath("//@data-creation-date").extract_first()

или

response.xpath("//main/section/@data-creation-date").extract_first()
...