Я хотел бы знать, как вы можете анализировать содержимое блока HTML и в то же время поддерживать порядок строк, отображаемых в документе HTML, используя this (Hpple) упаковщик, которыйработает с выражениями XPath.Среда - iOS.
Пример:
<html>
<body>
<div>
Lorem ipsum <a href="...">dolor</a> sit <b>amet,</b> consectetur
</div>
</body>
</html>
Допустим, мы хотим проанализировать все строки внутри тега <div>
в исходном порядке, чтобы получить следующий результат:
Lorem ipsum dolor sit amet, consectetur
Камнем преткновения является поддержание порядка строк.Легко получить все прямое содержимое <div>
, а также <a>
и <b>
отдельно или одновременно, используя выражение XPath, которое, однако, пропускает порядок, поэтому может привести к размещению содержимого <a>
и <b>
в конце строки.
Как этого добиться, используя выражение XPath с упомянутой оболочкой?
Обновление:
Одним из способов достижения этого с упомянутыми оберткой и платформой (особенно libxml2), по-видимому, является следующее выражение XPath:
//div/descendant-or-self::*/text()
Однако полученные элементы разделяются и не доставляются как одна строка, так чтосоединяться вручную.