Схема нутча определяет id (= url) как уникальный ключ.Если это не подходит для вас, измените его.Соответствующая строка в schema.xml
:
<uniqueKey>url</uniqueKey>
Но лучшим решением может быть следующее: Если вы можете получить доступ к вашему серверу с помощью
http://www.example.com
и
http://example.com
Вы должны рассмотреть сканирование только одного из них с использованием фильтров регулярных выражений для предотвращения дублирования.