хорошо, я совершенно новичок в SOLR и Lucene, но у меня есть Solr, работающий без настроек под Tomcat 6.x, и я только что просмотрел некоторые основные записи в вики.
У меня есть несколько вопросов, и мне тоже нужны некоторые предложения.
Solr может индексировать данные в файлах (XML, CSV), а также может индексировать БД. Можете ли вы просто указать его на URI / домен и проиндексировать веб-сайт так, как это сделал бы Google?
Если у меня есть веб-сайт с данными «Страницы», например «Имя страницы», «Содержимое страницы» и т. Д., А также «Данные о продукции», т. Е. «Название продукта», «SKU» и т. Д., Нужно ли мне два разные файлы Schema.xml? и если так, значит ли это два разных случая Solr?
Наконец, если у вас есть проект с большой реляционной и нормализованной базой данных, что, по вашему мнению, является лучшим подходом из трех вариантов ниже?
Служба промежуточного программного обеспечения, работающая в фоновом режиме, которая анализирует базу данных и вручную создает соответствующие файлы XML для последующей отправки в SOLR
Имейте SOLR, индексируют DB непосредственно. В этом случае, было бы лучше просто указать SOLR на представления, которые бы абстрагировали все связи таблиц?
Любые другие опции, о которых я не знаю?
Контекст: мы работаем в среде Windows 2003, .NET 3.5, SQLServer 2005/2008
ура!