Question

Я разрабатываю систему обнаружения контекста, которая представляет собой смесь поиска и предложений.В настоящее время я ищу библиотеку для индексации.После некоторого расследования я остался на Lucene и Терьере и обнаружил, что Индри не чувствует себя комфортно.

Каковы недостатки обоих?С какой проблемой я могу столкнуться при их использовании?

Правда ли, что у терьера нет инкрементальной индексации (каждый раз, когда добавляется новый документ, мне нужно перестраивать и переиндексировать все)?требования: - легкое добавление новых документов - легкое внедрение методов оценки - тихая четко определенная модель

И еще одна вещь: терьер все еще активен?Я не видел обновлений с 10/03/2010 журнал изменений терьера

Scott Feinberg · Answer 1 · 16 мая 2011

Какую базу данных вы собираетесь использовать? По моему опыту, Lucene гораздо лучше задокументирована, чем Terrier.

Вот статья, сравнивающая Люсена и Терьера:

http://text -analytics.blogspot.com / 2011/05 / Ява-Автозагрузка toolkits.html

Индексирование двигателя

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Индексирование двигателя

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы