PHPCrawl иногда возвращает с пустыми руками - PullRequest
0 голосов
/ 22 октября 2010

Я использую класс PHPCrawl для создания пауков на сайтах и ​​создания списка ссылок. Все работает хорошо, если медленно, а затем я использую ссылки для выполнения других задач.

Я столкнулся с проблемой, когда при первом запуске сценария он завершается безрезультатно, а затем при следующем запуске он работает, как и ожидалось. Это сбой примерно в 30% случаев.

Сначала я подумал, что это проблема с сетью или рабочей станцией, но та же проблема возникает на другом компьютере в другом месте с использованием другого провайдера.

Кто-нибудь еще использовал этот класс и сталкивался с той же проблемой?

1 Ответ

0 голосов
/ 22 октября 2010

После обширного тестирования я обнаружил, что это, похоже, связано с настройкой streamTimeout.

Проблема здесь в том, что слишком высокое значение приводит к очень медленному сканированию. Возрождение со связью Timeout, кажется, немного опосредует это.

...