Допустим, у вас есть веб-страница:
<html>
<head>
<meta name="description" content="Hello World Test">
</head>
<body>
<h1>Hello World!!!</h1>
<p>How are you today?</p>
<p>What have you been up to?</p>
</body>
</html>
Есть ли способ затем перебрать узлы на странице и затем, если узел содержит текст, извлечь текст?
Я бы тогда хотел организовать текст по Xpath.
Так что выше будет:
/ html / body / h1: Hello World !!!
/ html / body / p [1]: Как поживаете сегодня?
/ html / body / p [2]: Чем ты занимался?
Большое спасибо