Question

Я пытаюсь удалить заголовок сайта, но у него нет класса и идентификатора.

Обычно я использую это, чтобы получить заголовок, который имеет класс:

titles = response.xpath('//a[@class="result-title hdrlnk"]/text()').extract()

Сейчас я пытаюсь извлечь текст, пожалуйста, смотрите скриншот, не могли бы вы исправить это? [https://i.stack.imgur.com/k6aCN.png][1]

starrify · Answer 1 · 10 ноября 2018

Вы можете найти определенный узел по любому атрибуту (не только по классу и идентификатору) или по его относительному положению с некоторыми другими.

Несколько примеров текста на скриншоте:

response.xpath('//div[@class="job-title-text"]/a/text()')
response.xpath('//a[contains(@onclick,"clickJObTitle")]/text()')
response.xpath('//a[contains(@href,"jobdetails")]/text()')
response.css('div.job-title-text a::text')
response.css('a[onclick*=clickJObTitle]::text')
response.css('a[href*=jobdetails]::text')

Смотри также:

Выбор с помощью неклассного тега в scrapy python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Выбор с помощью неклассного тега в scrapy python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов