Я использую не содержать в своем xpath, но, похоже, он не работает, так как он по-прежнему выбирает элемент под h2 под названием «Что мне не нравится в компании», который в моем не содержится.
HTML:
<div itemprop="reviewBody" class="review-body"><h2 class="h3">Suggestions for improvement</h2><p></p><ul><li>Better managers the ones they have suck</li></ul><h2 class="h3">What I like about the company</h2><p>Great company thanks again for sure</p><h2 class="h3">What I dislike about the company</h2><p>The fact they didn't care about my health</p></div>
Xpath:
response.xpath("(//div[@class='review-body'])/h2[contains(.,'What I like about the company') and not(contains(.,'What I dislike about the company'))]/following-sibling::p/text()").getall
Мне нужен код, чтобы вытащить «p» под h2 под названием «Что мне нравится в компании», но не « p 'в разделе "Что мне не нравится в компании", спасибо