Как мы можем только выбирать и извлекать текст, который является только частью родительского узла. Вот HTML-код, над которым я работаю. Мне нужно извлечь только "$ 1950", используя xpath. Когда я выбираю родительский узел и извлекаю его текстовое содержимое, я также получаю текстовое содержимое его потомков, но мне нужно только текстовое содержимое родительского узла.
<span class="rentRollup">
<span class="longText">3 Bedrooms</span>
<span class="shortText">3 Beds</span>
$1,950
</span>
Я пытался использовать xpath, ноон печатает весь родительский узел, а также данные дочерних узлов.
url = 'https://www.apartments.com/214-taylor-st-raleigh-nc/cr6tchd/'
#intializing request headers
ua = UserAgent()
header = {'User-Agent':str(ua.chrome)}
response = requests.get(url, headers=header)
print(response)
byte_data = response.content
source_code = html.fromstring(byte_data)
name=source_code.xpath("//*[contains(text(), '3 Bedrooms')]/..")
name=name[0].text_content()
print(name)