URL захвата Xpath - PullRequest
       2

URL захвата Xpath

0 голосов
/ 17 декабря 2018

Обычно я получаю то, что хочу с Xpath, но на этот раз я не могу получить URL-адрес, который я хочу.На этой странице есть пара URL-адресов в этом теге div "btn-cont col-md-8 typesquare_tags", поэтому я пытаюсь получить только одну ссылку: href="https://www.31sumai.com/mfr/K1503/outline.html"

Итак, я использую этот блок кода, но не могу его достать.

foreach($links as $href){
        $getContent = pageContent($href);
        $getXpath = new \DOMXPath($getContent);
        $Route = $getXpath->query("//div[@class='btn-cont col-md-8 typesquare_tags']/a[3]");
        foreach ($Route as $link3){
            $linkBOX[] = trim($link3->getAttribute('href'));
        }
    }

Я что-то здесь упускаю?

PS.pageContent - это функция, которая включает DOMDoc / LoadHTML

1 Ответ

0 голосов
/ 17 декабря 2018

"typesquare_tags" имя класса добавляется динамически.Попробуйте найти div по первым двум именам классов:

"//div[@class='btn-cont col-md-8']/a[3]"

или

"//div[contains(@class, 'btn-cont') and  contains(@class, 'col-md-8')]/a[3]"
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...