Xpath получает текстовое содержимое из нескольких тегов - PullRequest
0 голосов
/ 06 ноября 2018

У меня есть этот шаблон HTML:

<ul>
<li>
<div>
<span class="field_full"><strong>Title 1</strong></span> :
<span itemprop="alternativeHeadline">
<span itemprop="alternativeHeadline">
DESC 1
</span>
</span></div>
</li>
<li>
<div>
<span class="field_full"><strong>Title 2</strong></span> :
<span itemscope="" itemtype="http://schema.org/type2" itemprop="type2">
<a href="/"><span itemprop="name">DESC 2</span></a>
</span>
</div>
</li>
<li>
<div>
<span class="field_full"><strong> Title 3</strong></span>:
<span itemprop="type3" itemscope="" itemtype="http://schema.org/type3">
<a href="/"><span itemprop="name">DESC 3-1</span></a>, <a href="/"><span itemprop="name">DESC 3-2</span></a>, <a href="/"><span itemprop="name">DESC 3-3</span></a>
</span>
</div>
</li>
<li>
<span class="field_full"><strong>Title 4</strong></span>:
<span> <a href="/">DESC 4</a></span>
</li>
<li>
<span class="field_full"><strong>Title 5</strong></span>:
<span itemprop="type">
<a href="/">DESC 5-1</a>, <a href="/">DESC 5-2</a>
</span>
</li>
<li>
<span class="field_full"><strong>Title 6</strong></span>:
<span itemprop="type">
DESC 6
</span>
</li>
<li>
<span class="field_full"><strong>Title 7</strong></span>:
<span itemprop="type">
DESC 7
</span>
</li>
<li>
<span class="field_full"><strong>Title 8</strong></span>:
<span itemprop="type">
<a href="/">DESC 8</a>
</span>
</li>
</ul>

Я хочу использовать xpath для получения ожидаемого результата:

TITLE 1 = DESC 1
TITLE 2 = DESC 2
TITLE 3 = DESC 3-1, DESC 3-2, DESC 3-3
TITLE 4 = DESC 4
TITLE 5 = DESC 5-1, DESC 5-2
TITLE 6 = DESC 6
TITLE 7 = DESC 7
TITLE 8 = DESC 8

Что я пробовал?

$dom = new DOMDocument();
$dom->loadHTML($html_string);
$xpath = new DOMXpath($dom);

$elements = $xpath->query("//span[@class='field_full']");
foreach($elements as $e) {
    echo $e->nodeValue . '<br/>';
}

Но, к сожалению, это возвращение только TITLE 1, TITLE 2, TITLE 3 и т. Д.

Я хочу получить их соответствующие значения (в данном случае DESC 1, DESC 2 и т. Д.).

Какой подход я могу использовать для достижения этой цели?

Спасибо в

Ответы [ 2 ]

0 голосов
/ 06 ноября 2018

Чтобы получить точный желаемый результат, вы можете использовать относительный запрос XPath, используя исходный узел <span> в качестве корневого:

$elements = $xpath->query("//span[@class='field_full']");
foreach($elements as $e) {
    echo trim($e->nodeValue) . ' = ';
    $spans = $xpath->query("following-sibling::span", $e);
    foreach ($spans as $span) echo " " . trim($span->nodeValue);
    echo "<br/>";
}

Выход:

Title 1 =  DESC 1<br/>
Title 2 =  DESC 2<br/>
Title 3 =  DESC 3-1, DESC 3-2, DESC 3-3<br/>
Title 4 =  DESC 4<br/>
Title 5 =  DESC 5-1, DESC 5-2<br/>
Title 6 =  DESC 6<br/>
Title 7 =  DESC 7<br/>
Title 8 =  DESC 8<br/>

Демонстрация на 3v4l.org

0 голосов
/ 06 ноября 2018

Следующее выражение должно сделать это:

//span[@class="field_full"]/following-sibling::span

Демо: https://3v4l.org/rTmq9

...