Hodoop + Nutch 1.15 + Solr Cloud 7.3.1 индекс нет результата - PullRequest
0 голосов
/ 06 октября 2018

Его у меня есть кластер на основе Hadoop.Я использую Nutch 1.15 с успехом и ползаю несколько URL.Я установил Solr 7.3.1, и мне нравится использовать Cloud One, поэтому, когда я запускаю SOlr с этим cmd:

./solr-7.3.1/bin/solr start -c

, я также установил в nutch-site.xml некоторые solr vars:

<property>                                                                                                 
   <name>solr.server.type</name>                                                                           
   <value>cloud</value>                                                                                    
</property>                                                                                                

<property>
   <name>solr.server.url</name>                                                                       
   <value>http://localhost:8983/solr/nutch_collection/</value>                                       
</property>

<property>
   <name>solr.zookeeper.url</name>                                                        
   <value>http://localhost:9983/</value>                                                                 
</property> 

и это для индекса для решения:

 bash ./run_nutch.sh solrindex -Dsolr.server.url=http://localhost:8983/solr/nutch_collection/ crawl/crawldb -linkdb crawl/segments/*

Нет ошибок и завершения работы, но нет документов в моей коллекции ...

Что мне не хватает?Спасибо

1 Ответ

0 голосов
/ 02 ноября 2018

solr.server.url теперь удален из версии Nutch 1.15.Теперь вам нужно настроить один XML-файл (conf / index-writers.xml)

Настройка значения по умолчанию в index-writers.xml: http://localhost:8983/solr/nutch/,Так что либо вы хотите изменить это значение в XML-файле, либо создать ядро ​​с именем nutch вместо n utch_collection и проверить его.

https://apache.org/dist/nutch/1.15/CHANGES.txt

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...