Мы используем версию Nutch 2.3.1-src.Выполнение команды сканирования с глубиной 200.Но после нескольких итераций выборка завершается неудачно с упомянутым ниже исключением времени выполнения.
java.lang.RuntimeException: java.lang.IllegalArgumentException: KeyValue size too large
Exception at GoraRecordWriter.class while writing to datastore: KeyValue size too large
Команда сканирования:
/Data/Apache/apache-nutch-2.3.1/runtime/local/bin/crawl /Data/Apache/apache-nutch-2.3.1/runtime/local/urls crawl-nutch http://localhost:9200/test/ 200