Question

Я использую следующий веб-сайт для тестирования:

scrapy shell http://example.webscraping.com/places/default/user/login#

И проведу некоторый тест:

Ввод 1:

response.xpath('//div//[@style]/input')

Выход 1:

[<Selector xpath='//div[@style]/input' data='<input name="_next" type="hidden" value='>,  

<Selector xpath='//div[@style]/input' data='<input name="_formkey" type="hidden" val'>,  

<Selector xpath='//div[@style]/input' data='<input name="_formname" type="hidden" va'>]

Вход 2:

response.xpath('//div//@style/input')

Выход 2:

[]

Вход 3:

response.xpath('//div//@style/input') == response.xpath('//div[style]/input')

Выход 3:

True

Я хочу знать, как отличаются 1 и 2, спасибо.

Valdir Stumm Junior · Answer 1 · 24 сентября 2018

Я думаю, что вы ищете этот селектор:

response.xpath('//div[@style]/input')

Вот как это работает:

выбрать все элементы div из документа (//div);
для каждого из них выберите только те, которые имеют атрибут style ([@style]);
выберите узлы input, которые являются потомкамиэлементы, выбранные на шаге 2 (/input).

Ваш второй селектор (//div//@style/input) не будет работать хорошо, потому что он:

выбирает все div элементов со страницы (//div);
выберите атрибут style для каждого потомка элементов div, выбранных на шаге 1 (//@style);
выберите input узлы, которые являются прямыми потомками атрибутов style, чего не существует (/input).

Атрибут Scrapy Selector

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Атрибут Scrapy Selector

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов