Индексирование двигателя - PullRequest
2 голосов
/ 16 мая 2011

Я разрабатываю систему обнаружения контекста, которая представляет собой смесь поиска и предложений.В настоящее время я ищу библиотеку для индексации.После некоторого расследования я остался на Lucene и Терьере и обнаружил, что Индри не чувствует себя комфортно.

Каковы недостатки обоих?С какой проблемой я могу столкнуться при их использовании?

Правда ли, что у терьера нет инкрементальной индексации (каждый раз, когда добавляется новый документ, мне нужно перестраивать и переиндексировать все)?требования: - легкое добавление новых документов - легкое внедрение методов оценки - тихая четко определенная модель

И еще одна вещь: терьер все еще активен?Я не видел обновлений с 10/03/2010 журнал изменений терьера

1 Ответ

1 голос
/ 16 мая 2011

Какую базу данных вы собираетесь использовать? По моему опыту, Lucene гораздо лучше задокументирована, чем Terrier.

Вот статья, сравнивающая Люсена и Терьера:

http://text -analytics.blogspot.com / 2011/05 / Ява-Автозагрузка toolkits.html

...