Question

Я могу извлечь текст из диапазона ниже:

с этим xpath:

'./div/a/div/div/div/span/text()'

результат:

(12)

но, как ни странно, иногда сервер помещает теги комментариев между ними, поэтому я не могу получить желаемый результат,

review = product.xpath('./div/a/div/div/div/span/text()').extract_first()
In [1]: review
Out[2]: '('

review = product.xpath('./div/a/div/div/div/span').extract_first()

In [3]: review
Out[4]: '<span class="_2wY6y7fV">(<!-- -->12<!-- -->)</span>'

, хотя я не вижу тега комментарияна Chrome DevTools, как на первом рисунке, очень странно.

Как можно обойти теги комментариев (если они будут отображены) и получить результат?

Michael Kay · Answer 1 · 16 октября 2018

Поэтому лучше избегать использования text () для получения текстовых узлов, вместо этого используйте string () для получения строкового значения содержащего элемента, который объединяет все текстовые узлы, пропускающие комментарии.

К сожалению, хотя некоторые приложения на основе XPath допускают только выражения, которые возвращают узлы, они не допускают выражения, которые возвращают строки, и если это имеет место в Scrapy, то вы попадаете в ловушку.

Umair · Answer 2 · 16 октября 2018

Попробуйте

import re
reviews = "".join(product.xpath('./div/a/div/div/div/span').extract())
reviews = re.findall(r"\d+", reviews)

Я имею в виду, не используйте /text(), только получите необработанный HTML, а затем получите целочисленное значение через Regex

Получил тег комментария между текстом span для извлечения с помощью xpath

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Получил тег комментария между текстом span для извлечения с помощью xpath

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов