Scrapy, как скрести сложную метку - PullRequest
0 голосов
/ 05 ноября 2019

Я пытался очистить это, но все еще не мог понять это. Я могу получить только под 1 столбец в файле Excel. Любая добрая душа готова помочь мне? HTML-код и желаемый результат приведены ниже:

HTML-код:

enter image description here

Желаемый результат:

enter image description here

Ответы [ 2 ]

1 голос
/ 05 ноября 2019

Вы можете получить желаемый результат с XPath более элегантным способом:

project_acronym = response.xpath('//span[.="Project acronym"]/following-sibling::span[1]/text()').get()
project = response.xpath('//span[.="Project"]/following-sibling::span[1]/text()').get()
1 голос
/ 05 ноября 2019

Используйте соответствующие селекторы CSS

  • Сокращение: .views-label-acronym
  • Проект: .views-field-title .field-content
  • Исследователь: .views-label-xml-исследователь .field-content

и т. д.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...