Как получить полную ссылку из атрибута href с помощью PHP DOM? - PullRequest
0 голосов
/ 11 ноября 2018

Я пытаюсь разобрать ссылки с этой страницы .

Я использую этот код:

$link = 'https://ws-na.assoc-amazon.com/widgets/cm?t=websitcom05-20&o=1&p=26&l=ur1&category=primeent&banner=1XSEYPQA2R6RS2D2B802&f=ifr';
$pageContent = file_get_contents($link);
$html = str_get_html($pageContent);

$body = $html->find('body', 0, true);

foreach ($body->find('area') as $area)
{
    echo $area->href;
}

Выход составляет http://rcm-na.amazon-adsystem.com/e/cm/privacy-policy.html?o=1 https://www.amazon.com

Вторая ссылка урезана. Пожалуйста, помогите мне получить полную ссылку со страницы.

Мне нужен вывод: https://www.amazon.com/gp/video/offers/ref=dvm_us_dd_as_evgrn?ie=UTF8&linkCode=ur1&redirectToAsin=B01EN8ZQKS&tag=INSERTSTOREID&tag=websitcom05-20

1 Ответ

0 голосов
/ 11 ноября 2018

Вы, похоже, используете "PHP Simple HTML DOM Parser" (находится по адресу: http://simplehtmldom.sourceforge.net/)

не полный "DOMDocument", поэтому он может иметь ограничения на то, что он может обрабатывать по ссылкам.

для DOMDocument есть вопрос, найденный здесь: Используя domDocument и анализируя информацию, я хотел бы получить содержимое 'href' тега 'a'

, который охватывает получение href

...