NCrawler не сканирует дальше первого URL, хотя MaxCrawlDepth> 1 - PullRequest
0 голосов
/ 17 февраля 2012

NCrawler не сканирует после первого URL, даже если MaxCrawlDepth> 1. Поэтому, если я укажу yahoo.com и MaxCrawlDepth = 3, он сканирует только эту страницу и останавливается.Я также проверил это, используя перехватчик пакетов, когда единственным адресом, на который он пошел, был yahoo.com.

Как мне заставить его сканировать каждую ссылку на странице?(У меня нет времени, чтобы проверить исходный код)

Ответы [ 2 ]

0 голосов
/ 02 декабря 2014

Это происходит на моей стороне, когда я добавляю HTMLAgilityPack, проверьте, есть ли он у вас, и удалите его.

0 голосов
/ 22 марта 2012

NCrawler ожидает полностью сформированный URL. Попробуйте заменить URL-адрес на http://www.yahoo.com

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...