PHP извлекает URL из HTML, используя DOMDocument и / или Regex - PullRequest
0 голосов
/ 26 сентября 2018

Я пытаюсь получить значение для ключа poster в html, которое равно https:\/\/example.com\/avt\/test.jpg

html

    <html><body> 
    <script>
         (function(window, sabaPlayer) {
          var options = JSON.parse('{"poster":"https:\/\/example.com\/avt\/test.jpg"}')
 })
    </script>
    </body></html>

Могу ли я сделать это с помощью DOMXPath?На странице больше html, но это именно та часть, которую я хочу.

$dom = new DOMDocument();

$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$result = $xpath->query("//script");

foreach($result as $node) {


}

Как мне это сделать?

В результате я хочу получить строку https:\/\/example.com\/avt\/test.jpg

1 Ответ

0 голосов
/ 26 сентября 2018

Я думаю, вы можете использовать regex для извлечения этого значения, что будет проще.

$txt = <<<TXT
<html><body> 
  <script>
     (function(window, sabaPlayer) {
      var options = JSON.parse('{"poster":"https:\/\/example.com\/avt\/test.jpg"}')
     })
</script>
</body></html>
TXT;

$matches = [];
preg_match('/JSON.parse\(\'(.*)\'\)/iu', $txt, $matches);

$parsed = json_decode($matches[1]);

Вывод будет stdClass со свойством poster

stdClass Object
(
    [poster] => https://example.com/avt/test.jpg
)

Вот как получить доступ к URL $parsed->poster

...