Как мне получить эту страницу программно? - PullRequest
0 голосов
/ 10 августа 2010

Вот страница ССЫЛКА НА САЙТ ЛИРИКИ

Если я использую обычный метод, все, что я получаю, это "http://lyricsvip.com", а не текст песни.

Ответы [ 3 ]

4 голосов
/ 10 августа 2010

это потому, что тексты песен загружаются с помощью Javascript, а «обычный» метод не выполняет Javascript, когда вы пытаетесь почистить страницу.

Похоже, вам не повезло, если только вам не удастсявыполнить Javascript-метод, найденный в источнике:

<body onload="javascript:getContent('aerosmith', 'crazy', '1281384888', '0475352e376cf1c3906afd8ec1b8ac70')"> 

Я уверен, что вы не сможете, так как он, вероятно, используется для предотвращения этого::)

1 голос
/ 10 августа 2010

Если вы действительно хотите это сделать, возможно .Вам нужно будет управлять чем-то вроде Gecko (используя, например, pywebkigtk ), чтобы открыть веб-страницу в полнофункциональном браузере, который может выполнять JS, а затем получить исходный код из этого после завершения рендеринга.

Однако вы не сможете сделать это с меньшими затратами.Если вы посмотрите на источник Javascript, то увидите, что он просто отправляет запрос AJAX POST на content.php:

var url = "content.php?artist=" + artist + "&title=" + title + "&time=" + time + "&check=" + check;

с check, вероятно, хэшированным идентификатором сеанса.Это, несомненно, должно помешать людям делать именно то, что вы делаете.

0 голосов
/ 10 августа 2010

если вы работаете в Windows, вы можете использовать PAMIE для управления браузером ....

...