Question

    import scrapy
    example='<div class="ParamText"><span>OWNER APP</span></div>
<div class="ParamText"><span>OWNER</span></div>
<div class="ParamText"><span>OWNER NAME</span></div>'
    scrapy.Selector(text=example).xpath('//*[@class="ParamText"]/span[contains(text(),"OWNER")]').extract_first()

Здесь мне нужно очистить ВЛАДЕЛЬЦА только иногда 3 пролета. Я получу ВЛАДЕЛЬЦА

. Вывод:

Я получаю: ВЛАДЕЛЕЦ ПРИЛОЖЕНИЯ

Я хочу: ВЛАДЕЛЕЦ

vezunchik · Answer 1 · 23 января 2019

Вы можете выбрать по текстовому уравнению, например scrapy.Selector(text=txt).xpath('//*[@class="ParamText"]/span[text()="OWNER"]').get() или без подробностей, он даст вам первое: scrapy.Selector(text=txt).css('div.ParamText span').get()

Gallaecio · Answer 2 · 23 января 2019

Вы можете использовать регулярное выражение ^OWNER$ для сопоставления диапазонов, содержащих только OWNER.

Заменить contains(text(),"OWNER") на re:test(text(),"^OWNER$").

Преимущество регулярных выражений состоит в том, что вы также можете использовать пробелы (^\s*OWNER\s*$) или поддерживать разные регистры букв ((?i)^OWNER$).

Scrapy Xpath с текстом (), равным

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Scrapy Xpath с текстом (), равным

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы