Репликация сервера Solr только для чтения - PullRequest
2 голосов
/ 11 июля 2010

Я создал индекс solr 1.4 и хотел бы обслуживать запросы к нему для приложений большого объема. Индекс, который я запрашиваю, является статическим - больше никаких обновлений не разрешено. Несколько клиентских приложений, отправляющих запросы на сервер, загружают процессор примерно до 200% в четырехъядерном Ubuntu-боксе, поэтому я подумал о репликации индекса на второй блок и параллельном его запуске для обеспечения большей пропускной способности. *

Я выключил solr, скопировал индекс в отдельный каталог, настроил сервер solr для указания на новый индекс и запустил их оба. Хотя исходный сервер работал, как и раньше, копии не удалось найти какие-либо документы.

Когда я делаю список каталогов на серверах, я вижу что-то немного странное: Это список оригинального индекса каталога

total 3581328
-rw-r--r-- 1 gene pal 2502676419 2010-07-08 20:53 _38.fdt
-rw-r--r-- 1 gene pal     488660 2010-07-08 20:53 _38.fdx
-rw-r--r-- 1 gene pal        198 2010-07-08 20:53 _38.fnm
-rw-r--r-- 1 gene pal  213752776 2010-07-08 20:54 _38.frq
-rw-r--r-- 1 gene pal     366496 2010-07-08 20:54 _38.nrm
-rw-r--r-- 1 gene pal  725677119 2010-07-08 20:54 _38.prx
-rw-r--r-- 1 gene pal    1124453 2010-07-08 20:54 _38.tii
-rw-r--r-- 1 gene pal   85260530 2010-07-08 20:54 _38.tis
-rw-r--r-- 1 gene pal     280471 2010-07-08 20:54 _38.tvd
-rw-r--r-- 1 gene pal  133020745 2010-07-08 20:54 _38.tvf
-rw-r--r-- 1 gene pal     977316 2010-07-08 20:54 _38.tvx
-rw-r--r-- 1 gene pal        299 2010-07-08 20:54 segments_1b
-rw-r--r-- 1 gene pal         20 2010-07-08 20:54 segments.gen

и это список копии:

total 3577796
-rw-r--r-- 1 gene pal 2502676419 2010-07-10 23:16 _38.fdt
-rw-r--r-- 1 gene pal     488660 2010-07-10 23:15 _38.fdx
-rw-r--r-- 1 gene pal        198 2010-07-10 23:15 _38.fnm
-rw-r--r-- 1 gene pal  213752776 2010-07-10 23:15 _38.frq
-rw-r--r-- 1 gene pal     366496 2010-07-10 23:15 _38.nrm
-rw-r--r-- 1 gene pal  725677119 2010-07-10 23:16 _38.prx
-rw-r--r-- 1 gene pal    1124453 2010-07-10 23:16 _38.tii
-rw-r--r-- 1 gene pal   85260530 2010-07-10 23:15 _38.tis
-rw-r--r-- 1 gene pal     280471 2010-07-10 23:16 _38.tvd
-rw-r--r-- 1 gene pal  133020745 2010-07-10 23:16 _38.tvf
-rw-r--r-- 1 gene pal     977316 2010-07-10 23:16 _38.tvx
-rw-r--r-- 1 gene pal        299 2010-07-10 23:15 segments_1b
-rw-r--r-- 1 gene pal         20 2010-07-10 23:15 segments.gen

Хотя размеры файлов выглядят одинаково, общее количество, отображаемое в верхней части каждого списка, отличается. И хотя сообщения запуска solr предполагают, что он смотрит на этот каталог

INFO: Opening new SolrCore at solr/, dataDir=./data/

Статистика администратора не показывает документов, доступных для решения

На что еще мне следует обратить внимание, чтобы решить эту проблему?

Спасибо

Gene

Ответы [ 2 ]

3 голосов
/ 13 июля 2010

Я обнаружил, что гораздо проще использовать Встроенный в Solr API репликации , чем копировать индексные файлы в файловой системе.

Создать новое пустое ядро ​​на своем ведомом устройстве.машина.Затем попросите ядро ​​выполнить репликацию с существующего мастера с помощью команды fetchindex.Solr возьмет на себя все остальное, что вам нужно.

Например, вы получите URL-адрес примерно такой:

http://slave_host:port/solr/corename/replication?command=fetchindex&masterUrl=http://master_host:port/solr/corename/replication

0 голосов
/ 12 июля 2010

(я опубликовал исходный вопрос до того, как создал учетную запись stackoverflow, и не могу понять, как редактировать оригинал; следовательно, второе сообщение, а не редактирование или комментарий; извините за путаницу.)

Да, я скопировал весь каталог solr, а затем отредактировал файл solrconfig.xml, чтобы он указывал на второе местоположение индекса. При запуске оба экземпляра solr сообщают правильные местоположения dataDir.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...