Новичок нуждается в помощи - Lucene - PullRequest
0 голосов
/ 26 января 2011

Я работаю над унифицированным проектом, который включает разработку веб-сайта. Я нахожусь на ранней стадии развития и просто хочу уточнить мое понимание того, что я узнал до сих пор. Мой сайт будет содержать базу данных (возможно, SQL или Oracle) с powerpoint, word и, возможно, некоторыми другими файлами, но в основном это.

Я могу использовать Lucene для: 1) Поиск на моем сайте по ключевым словам, чтобы найти и получить соответствующие страницы 2) Поиск и извлечение соответствующих файлов PowerPoint и Word из базы данных

Исходя из того, что я собрал, Lucene проиндексирует мой сайт и базу данных и найдет соответствующие страницы и файлы. Мне нужно будет добавить другое программное обеспечение, такое как сканеры и пользовательский интерфейс.

Как я уже сказал, я новичок в этом, и все это довольно сложно с самого начала, но верно ли то, что я понял?

Большое спасибо,

Phil

1 Ответ

1 голос
/ 31 января 2011

1) Вам нужно будет создать индекс люцена.

2) Один из способов - использовать Nutch для сканирования вашего сайта, и он вернет вам индекс Lucene, в котором будут проиндексированы все ссылки / данные с вашего сайта.

3) Я полагаю, что вы можете создать индекс lucene и для базы данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...