путь ползания ореха - PullRequest
       8

путь ползания ореха

2 голосов
/ 22 августа 2011

Я хотел бы знать, как заставить Nutch сканировать не только указанный мной домен, но и путь dir внутри указанного мной домена.Я знаю, что вы можете настроить эту информацию на regex-urlfilter.txt

1 Ответ

2 голосов
/ 24 августа 2011

Это должно сканировать только нужный вам домен / путь:

+.*www\.domain\.com/yourpath/.*  
#skip everything else  
-.*
...