Несколько индексных местоположений Solr - PullRequest
0 голосов
/ 26 марта 2012

Я новичок в Solr и пытаюсь найти наилучший способ индексации и поиска в наших каталогах.

Мы должны проиндексировать несколько производителей, и у каждого производителя свой каталог для каждой страны.Каждый каталог для каждого производителя в каждой стране составляет около 8 ГБ данных.

Я подумал, что может быть проще иметь индекс для производителя для каждой страны и иметь какой-то способ указать Solr в URL-адресе, какой индекс искать.

Это лучший способ сделать это?Если так, как бы я это сделал?С чего мне начать искать?Если нет, что будет лучшим способом?

Я использую Solr 3.5

1 Ответ

3 голосов
/ 26 марта 2012

В общем, есть два способа решения этой проблемы:

  1. Разделите каждый каталог на свое ядро, запустив большую многоядерную установку. Это будет держать каждый индекс физически отделенным друг от друга и позволит вам использовать различные свойства (язык и т. Д.) И конфигурацию для каждого ядра. Это может быть практичным, но потребует немало накладных расходов, если вы планируете выполнять поиск по всем ядрам одновременно. Позже будет легко разделить разные ядра на работающие на разных серверах - просто раскрутите ядра на другом сервере.

  2. Запустите все в одном ядре - если все атрибуты и свойства разных каталогов одинаковы, добавьте два поля - одно с указанием производителя, а другое с указанием страны. Отфильтруйте эти значения, если вам нужно ограничить число обращений к конкретной стране или производителю. Это позволит вам легко выполнять поиск по всему индексу, а масштабируемость может быть реализована путем репликации или чего-то подобного SolrCloud (в версии 4.0). Если вам нужна поддержка мультиязычности, у вас должно быть поле для каждого языка с настройками, необходимыми для этого языка (например, stemming).

В вики Solr есть несколько кусочков информации об этом, но я предлагаю просто попробовать один из методов и посмотреть, решит ли это вашу проблему. Переход на другое решение не должен быть слишком большой работой. Самая простая реализация - сохранить все в одном индексе.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...