PHP очищает заполненный ajax исходный код HTML - PullRequest
1 голос
/ 21 февраля 2011

Я купил скрипт, который собирает некоторую информацию на странице HTML в PHP (используя регулярные выражения в источнике HTML), который прекрасно работает, когда на странице только HTML. Однако некоторые фрагменты информации заполняются Ajax / Javascript, эта информация не может быть получена в процессе очистки (возвращаются только пробелы).

Это пример HTML-источника, который мне нужно почистить, {d10} {d1} и т. Д. - это временная метка. Это не экземпляр, когда я беру источник:

layout: '<p><span>Time Remaining</span><br><strong>{d10}{d1} : {h10}{h1} : {m10}{m1} : {s10}{s1}</strong><br><span>Days &nbsp; &nbsp;Hours  &nbsp; Mins  &nbsp; &nbsp; Sec</span>

Функция, вызываемая для получения источника HTML:

getContents($URL)

Есть ли другой способ получить исходный HTML-код из URL, который бы уже отображал все значения AJAX? Я читал о "CURL ()", это даст мне источник HTML со значениями, уже заполненными AJAX?

Спасибо

Ответы [ 2 ]

0 голосов
/ 21 февраля 2011

Технически это выполнимо. Вам нужно будет проанализировать URL-адрес из кода js, откуда запрашиваются данные xmlhttprequest. Затем вы можете вызвать этот URL с помощью curl из php и проанализировать данные. Задача состоит в том, чтобы понять, как события onload реализованы в js и на каких узлах DOM они действуют.

Если вы можете определить структуру URL-адреса ajax url (при условии, что он есть), то вы, вероятно, можете запросить параметры url для сбора данных из соответствующих элементов DOM.

0 голосов
/ 21 февраля 2011

вам понадобится скребок, который может сделать для этого javascript, но не уверен, что таковые имеются. Я уверен, что спам был бы на совершенно новом уровне, если бы они могли заставить ботов царапать js.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...