Я пытаюсь разобрать ссылки с этой страницы .
Я использую этот код:
$link = 'https://ws-na.assoc-amazon.com/widgets/cm?t=websitcom05-20&o=1&p=26&l=ur1&category=primeent&banner=1XSEYPQA2R6RS2D2B802&f=ifr'; $pageContent = file_get_contents($link); $html = str_get_html($pageContent); $body = $html->find('body', 0, true); foreach ($body->find('area') as $area) { echo $area->href; }
Выход составляет http://rcm-na.amazon-adsystem.com/e/cm/privacy-policy.html?o=1 https://www.amazon.com
http://rcm-na.amazon-adsystem.com/e/cm/privacy-policy.html?o=1 https://www.amazon.com
Вторая ссылка урезана. Пожалуйста, помогите мне получить полную ссылку со страницы.
Мне нужен вывод: https://www.amazon.com/gp/video/offers/ref=dvm_us_dd_as_evgrn?ie=UTF8&linkCode=ur1&redirectToAsin=B01EN8ZQKS&tag=INSERTSTOREID&tag=websitcom05-20
https://www.amazon.com/gp/video/offers/ref=dvm_us_dd_as_evgrn?ie=UTF8&linkCode=ur1&redirectToAsin=B01EN8ZQKS&tag=INSERTSTOREID&tag=websitcom05-20
Вы, похоже, используете "PHP Simple HTML DOM Parser" (находится по адресу: http://simplehtmldom.sourceforge.net/)
не полный "DOMDocument", поэтому он может иметь ограничения на то, что он может обрабатывать по ссылкам.
для DOMDocument есть вопрос, найденный здесь: Используя domDocument и анализируя информацию, я хотел бы получить содержимое 'href' тега 'a'
, который охватывает получение href