PHPCrawl: исключить URL-адреса и использовать? Query = - PullRequest
1 голос
/ 13 мая 2011

Я играю с PHPCrawl, и я хотел бы знать, знает ли кто-нибудь, можно ли исключить из сканирования все URL-адреса с параметрами (будь то .html или .php), например

domain.com/article.html?showComment=1289420017718

Ответы [ 2 ]

2 голосов
/ 13 мая 2011

Добавить шаблон непоследовательного соответствия для любого URL, содержащего знак вопроса:

$crawler->addNonFollowMatch(".*\?.*")

1 голос
/ 13 мая 2011

Я просто подумал, что это работает лучше

$crawler->addNonFollowMatch("/\?/");
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...