Одноядерный или многоядерный Solr - PullRequest
4 голосов
/ 22 июня 2011

Мы планируем развернуть Solr для поиска по нескольким сайтам, опубликованным на общей платформе CMS.

Будут отдельные сайты для каждого языка, на которых другие языки будут в основном переведены с английского.

Требования к поиску включают - выделение ключевых слов, предложения («вы имели в виду?»), Стоп-слова, огранку.

Мы оцениваем использование одноядерного или многоядерного варианта Solr.Какой рекомендуемый подход здесь?

Ответы [ 2 ]

6 голосов
/ 23 июня 2011

Вам нужна многоядерность, потому что вы не можете использовать пароли и стоп-слова в многоязычной базе данных.

Распространенными стоп-словами в английском языке являются «by» и «is», но во многих скандинавских языках эти слова означают «город» и «лед».

Если вы делаете многоядерный, каждый язык может иметь собственное ядро ​​с настроенным schema.xml, который выбирает правильный парадигматический модуль, стоп-слова и защищенные слова. Но одна и та же JVM запускает все это на одном сервере, поэтому вы не тратите дополнительные деньги на серверы для одного конкретного языка. Затем, если нагрузка слишком велика для одного сервера, вы реплицируете свою многоядерную установку, и все индексы извлекают выгоду из реплик.

0 голосов
/ 22 июня 2011

Вы должны использовать многоядерный подход. Если вы хотите запросить несколько ядер одновременно, вы можете использовать параметр shards http://wiki.apache.org/solr/DistributedSearch

...