Как я могу исключить определенные URL в Solr / Lucene - PullRequest
1 голос
/ 02 сентября 2010

Я установил новый экземпляр индексации Solr на веб-сайте.Я хочу, чтобы Solr НЕ индексировал определенные шаблоны URL.Есть ли способ упомянуть такой шаблон исключения?

С уважением, Paras

Ответы [ 3 ]

2 голосов
/ 02 сентября 2010

Это можно сделать в программе, индексировать только в том случае, если шаблон не соответствует шаблону исключения.

1 голос
/ 03 сентября 2010

У вас есть сканер, собирающий данные? Я бы склонялся к выполнению этой логики в гусеничном шасси. Solr - это скорее репозиторий, и я не думаю, что это лучшее место для размещения логики индексации

Эрик

1 голос
/ 02 сентября 2010

Вы можете выполнить фильтрацию в Solr, используя UpdateRequestProcessor . В этом UpdateRequestProcessor вы можете решить, следует ли индексировать документ, соответствует ли он вашему регулярному выражению.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...