Как отфильтровать изображения объявлений при использовании `simple html dom`, получить изображения сайта - PullRequest
0 голосов
/ 13 апреля 2011

Я хочу использовать simple_html_dom, чтобы получить изображения некоторых сайтов.это тестовый сайт.когда я использую некоторый основной код ниже, я могу получить все изображения.а как отфильтровать рекламу картинок?

<?php
header('Content-type:text/html; charset=utf-8');
require_once 'simple_html_dom.php';
$v = 'http://www.vimeo.com/';
$html = file_get_html($v);
foreach($html->find('img') as $element) {
            $image = $element->src;
            echo '<img src="'.$image.'" /><hr />';
        }
?>

Я вижу некоторые объявления также как jpg image format, но URL содержит ad или ads, или что-то вроде gif image format ... как написать некоторый код для фильтрацииОбъявления?спасибо.

1 Ответ

0 голосов
/ 13 апреля 2011

Поиск в вашем src, если он найдет строку объявления. Но это слишком большая возможность, как admin, address, reading ...

if (!preg_match("ads?", $element->src)) {
    //it's not an ad
}
...