Как структурировать ядра Solr для нескольких локалей и типов контента? - PullRequest
0 голосов
/ 04 января 2011

Я хочу запустить сервер Solr, чтобы объединить поиск по нескольким аспектам общедоступного веб-сайта. Прежде всего, существует несколько локалей (США, Ирландия, Япония и т. Д.) И несколько типов контента (форумы, обычные веб-страницы, страницы справки, продукты и т. Д.)

Я бы хотел иметь возможность выполнять поиск для одной локали, но возвращать результаты для нескольких типов контента, чтобы я мог отображать их в виде набора результатов с вкладками.

Возможные варианты:

  • Иметь одно ядро ​​для каждой локали и различать типы контента, используя поля в одном индексе.
  • Иметь одно ядро ​​для каждого типа контента.
  • Иметь одно ядро ​​для каждой комбинации типа контента / локали.
  • Одноядерный / единый индекс для всего.

Вопросы:

В вики Solr упоминается, что многоядерные процессоры дают выигрыш в производительности примерно на 10 млн. Документов, и я думаю, что мы, вероятно, справляемся с этим, даже учитывая все локали и типы контента. Тем не менее, решение простого объединения всех данных в один индекс кажется немного грязным и потенциально трудным для масштабирования. Тем не менее, одно ядро ​​отлично подходит для получения единого набора результатов, так как мне не приходится многократно искать по всем ядрам.

Кто-нибудь использовал многоядерный, кто может посоветовать мне?

1 Ответ

1 голос
/ 07 января 2011

Похоже, есть некоторый интерес к этому вопросу, поэтому я подумал, что начну обновлять ответ с некоторых из моих выводов.

Прежде всего, есть некоторые реальные преимущества разделения ядер по локали, посколькукаждому языку легко иметь свои стоп-слова и настройки.В моем случае я никогда не собираюсь искать по локалям, так что это логично.Кроме того, это может дать мне некоторое увеличение скорости, потому что размер индекса для каждого ядра меньше.

Что касается разделения типов контента по ядрам, я все еще экспериментирую с одним типом контента, поэтому я обновлюкогда я расширяюсь.

...