Indexer: java.io.IOException: задание не выполнено - PullRequest
0 голосов
/ 30 апреля 2018

Я использую Solr 5.4.1 и Apache Nutch 1.12. Я могу сканировать данные, но на заключительном этапе индексации в Solr я получил следующие ошибки.

 SOLRIndexWriter
    solr.server.url : URL of the SOLR instance
    solr.zookeeper.hosts : URL of the Zookeeper quorum
    solr.commit.size : buffer size when sending to SOLR (default 1000)
    solr.mapping.file : name of the mapping file for fields (default solrindex-mapping.xml)
    solr.auth : use authentication (default false)
    solr.auth.username : username for authentication
    solr.auth.password : password for authentication
SolrIndexer: deleting 1/1 documents
SolrIndexer: deleting 1/1 documents
Indexer: java.io.IOException: Job failed!
    at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:836)
    at org.apache.nutch.indexer.IndexingJob.index(IndexingJob.java:145)
    at org.apache.nutch.indexer.IndexingJob.run(IndexingJob.java:228)
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70)
    at org.apache.nutch.indexer.IndexingJob.main(IndexingJob.java:237)

1 Ответ

0 голосов
/ 15 июня 2018

Убедитесь, что ваше имя индекса в нижнем регистре.

Убедитесь, что в вашем hbase_site.xml указаны правильные пути к файлам hbase.rootdir, hbase.data и hbase.zookeeper-data и файла журнала.

Наконец, убедитесь, что скопировали hbase_site.xml в ваш каталог nutch / conf. Если вы используете nutch 2.x, сделайте это до компиляции с помощью ant или перекомпилируйте (ant clean, ant runtime), как только он там будет.

...