Я сканирую сайт с помощью Nutch 1.4, я понимаю, что Nutch не сканирует все ссылки на этом сайте. у меня нет фильтра и нет предельных правил для сканирования. например Nutch никогда не сканировать эту ссылку:
http://www.irna.ir/News/30786427/سوء-استفاده-از-نام-كمیته-امداد-برای-جمع-آوری-رای-در-مناطق-محروم/سياسي/
если я дам эту ссылку Nutch для сканирования, Natch никогда не будет сканировать эту ссылку. этот сайт на фарси, а не на английском.
Как я могу сканировать эту ссылку?