Как сканировать и загружать все PDF-файлы по ссылке HTML? - PullRequest
0 голосов
/ 02 февраля 2012

Это мой код для сканирования всех PDF-ссылок, но он не работает. Как скачать по этим ссылкам и сохранить в папку на моем компьютере?

<?php
set_time_limit(0);
include 'simple_html_dom.php';

$url = 'http://example.com';
$html = file_get_html($url) or die ('invalid url');

//extrack pdf links
foreach($html->find('a[href=[^"]*\.pdf]') as $element)
echo $element->href.'<br>';
?>

Ответы [ 2 ]

2 голосов
/ 02 февраля 2012
foreach($htnl->find('a[href=[^"]*\.pdf]') as element)
           ^---typo. should be an 'm'        ^---typo. need a $ here

Как ваш код "не работает", кроме как из-за описанной выше опечатки?

0 голосов
/ 02 февраля 2012

Вы изучили phpquery?http://code.google.com/p/phpquery/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...