Какой XPath я должен использовать для извлечения содержимого <div>, которому предшествует другой <div>с определенной меткой? - PullRequest
0 голосов
/ 08 февраля 2019

Мне нужно извлечь характеристики и характеристики всех автомобилей из carpages.co.uk, пример страницы http://www.carpages.co.uk/guide/bmw/bmw-3-series-318i-se.asp, и у каждой функции есть изображение с тегами ALT: стандарт / опционально / не применимо

//div/following::div[contains(.,"Power Steering")]//img/@alt

Я попробовал вышеупомянутый XPath, но он получает все строки функций вместо того, чтобы получать только тег ALT строки, которую я пометил, в этом примере Power Steering.Удаление косой черты из // img сделало так, чтобы она ничего не извлекала.

Мне также нужно извлечь другие спецификации, такие как мощность, крутящий момент и т. Д.

Может ли кто-нибудь помочь мне с работающим XPath?

1 Ответ

0 голосов
/ 08 февраля 2019

Попробуйте этот XPath:

//div[contains(., "Power Steering")]/following::div[1]/img/@alt
...