Я играю с PHPCrawl, и я хотел бы знать, знает ли кто-нибудь, можно ли исключить из сканирования все URL-адреса с параметрами (будь то .html или .php), например
domain.com/article.html?showComment=1289420017718
Добавить шаблон непоследовательного соответствия для любого URL, содержащего знак вопроса:
$crawler->addNonFollowMatch(".*\?.*")
Я просто подумал, что это работает лучше
$crawler->addNonFollowMatch("/\?/");