Выбор с помощью неклассного тега в scrapy python - PullRequest
0 голосов
/ 10 ноября 2018

Я пытаюсь удалить заголовок сайта, но у него нет класса и идентификатора.

Обычно я использую это, чтобы получить заголовок, который имеет класс:

titles = response.xpath('//a[@class="result-title hdrlnk"]/text()').extract()

Сейчас я пытаюсь извлечь текст, пожалуйста, смотрите скриншот, не могли бы вы исправить это? [https://i.stack.imgur.com/k6aCN.png][1]

1 Ответ

0 голосов
/ 10 ноября 2018

Вы можете найти определенный узел по любому атрибуту (не только по классу и идентификатору) или по его относительному положению с некоторыми другими.

Несколько примеров текста на скриншоте:

response.xpath('//div[@class="job-title-text"]/a/text()')
response.xpath('//a[contains(@onclick,"clickJObTitle")]/text()')
response.xpath('//a[contains(@href,"jobdetails")]/text()')
response.css('div.job-title-text a::text')
response.css('a[onclick*=clickJObTitle]::text')
response.css('a[href*=jobdetails]::text')

Смотри также:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...