использование curl для перехода с одной веб-страницы на другую с использованием JavaScript - PullRequest
0 голосов
/ 06 января 2010

У меня есть webpage1.html с гиперссылкой, чья href = "some / javascript / function / outputLink ()"

Теперь, используя curl (или любой другой метод в php), как вывести гиперссылку (в формате http: //) из функции javascript (), чтобы я мог перейти на следующую страницу.

Спасибо

Ответы [ 2 ]

1 голос
/ 06 января 2010

Тебе придется очистить JavaScript. Выясните, где находится функция, и посмотрите, какой URL она использует.

Иногда http:// опускается для ссылок, которые находятся на той же странице, так что это не будет хорошей поисковой ссылкой.

На данный момент единственная полезная вещь - это попытаться понять код JavaScript самостоятельно, и как только вы найдете ссылку , вы можете использовать regex для программной фильтрации результата PHP.

preg_match("/url + \'\/apples.html/g", "blah blah var javaScriptVar= url + '/apples.html';", $matches);
0 голосов
/ 06 января 2010

Прямого пути нет. Существует очень мало библиотек, которые могут отлично выполнять то, что вам нужно. Я думаю http://www.dapper.net/ - это то, что вам нужно. Я не уверен, что это идеальное решение. Dapper.net поможет вам разобрать текст и ссылки и, вероятно, также обработать JavaScript.

...