Установить это свойство в nutch-site.xml
. (по умолчанию его значение true, поэтому он добавляет ссылки на crawldb)
<property>
<name>db.update.additions.allowed</name>
<value>false</value>
<description>If true, updatedb will add newly discovered URLs, if false
only already existing URLs in the CrawlDb will be updated and no new
URLs will be added.
</description>
</property>