Мне нужна помощь в создании поисковой системы в Java - PullRequest
0 голосов
/ 25 февраля 2011

Моя проблема в том, что я собираюсь разработать сайт, на который каждый загружает файл doc, файлы txt и т. Д. Теперь мне нужен компонент, который фактически вставляет файл для некоторых ключевых слов и поддерживает его индекс. А также, что индекс должен обновляться на основе данных Strutured, так как документ может активно просматриваться и так далее. Когда другой пользователь пытается просмотреть этот список документов на основе какого-либо ключевого слова и некоторых уточненных данных, как упоминалось ранее, пользователь должен быстро найти этот список. И он должен поддерживать Multi Language. У нас есть alogorthim, но нам нужен API с открытым исходным кодом для чтения файла, индексирующего файл с данными Unstrutured на основе ключевого слова. Может ли кто-нибудь может помочь в этом.

Ответы [ 2 ]

2 голосов
/ 25 февраля 2011

Lucene с Solr - лучшее решение с открытым исходным кодом.

1 голос
/ 25 февраля 2011

Это не тривиальная задача, поэтому зачем изобретать, когда другие уже это сделали: попробуйте Apache Lucene .

...