Шаги последовательности индексации для открытого исходного кода Lucene, работа с SQL или Nosql - PullRequest
0 голосов
/ 04 февраля 2011

Я новичок в игре с открытым исходным кодом. У меня был вопрос, прежде чем я углублюсь в то, что я планирую сделать. Предполагая, что я планирую использовать c # без NoSQL (не планируется какой (RavenDb или MongoDb)), я хотел бы выполнить индексацию для сайта в asp.net.

Я хотел бы использовать Lucene.net для индексации данных и ссылок на страницы на моем сайте. Когда вы фактически скажете Lucene.Net начать индексацию?

Я имею в виду, это фоновый процесс, который начинает индексирование каждую ночь, точно так же, как индексы SharePoint, или в тот момент, когда вы вызываете insert для nosql в то время, когда вам нужно вызывать для индексации записи.

Как насчет ссылок на страницах, когда должен работать механизм сканирования. Я думаю, что я думаю о мире SharePoint, и некоторые люди на этом форуме должны его исправить.

Меня особенно интересует последовательность шагов, извините, я не понимаю, когда и почему. Любое объяснение или ссылки на примеры помогут.

Ценю вашу помощь.

Спасибо

Sweety

1 Ответ

0 голосов
/ 04 февраля 2011

Lucene - это поисковая система, а не сканер. Поэтому вам нужно найти сканер, который вставляет данные в индекс Lucene.

Думайте о Lucene как о сервере SQL. Он может хранить данные и получать данные на основе запросов. Но вы должны создать приложение, которое фактически вставляет и запрашивает данные.

Вы могли бы очень хорошо использовать Solr (построенный на основе Lucene) и Nutch, оба проекта Java, и использовать веб-сервисы между вашим приложением C # и поисковым индексом. Java-версия Lucene также находится в постоянном развитии, в то время как версия .Net находится в стадии разработки.

...