Как быстро документ доступен для поиска в Solr? - PullRequest
1 голос
/ 02 декабря 2011

Мне нужен небольшой совет по предложенной архитектуре с Solr.

Наши документы будут в формате XML и, вероятно, (25–100 кБ) - частью.У нас будет два потока документов.Одним из них является основной поток, который будет получать 15-60 документов в секунду.Как только документ поступает в основной поток, его необходимо найти в течение 2 часов.Другой поток - это приоритетный поток, который будет иметь только 200-500 в день, но документы в этом потоке должны быть доступны для поиска в течение 1-25 секунд.

Если это имеет значение, мы планируем запустить его на скромном уровне.стандартное оборудование (raid6 по сравнению с обычными дисками sata, двухъядерный Xeon, оперативная память 8 ГБ).

Легко ли доступны предлагаемые нами SLA или нам потребуется оборудование корпоративного класса?

1 Ответ

3 голосов
/ 02 декабря 2011

Как только документ будет опубликован в Solr, как быстро он будет доступен для поиска?

Как только оно будет зафиксировано и доступен новый IndexSearcher.

Возможно, вас заинтересует параметр commitWithin команды добавления , чтобы убедиться, что добавляемый вами документ будет доступен для поиска в течение указанного времени.

Сколько времени занимает фиксация, зависит от ряда факторов: автоподогрев, mergeFactor ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...