mg4j против апача люцен - PullRequest
5 голосов
/ 17 февраля 2011

Кто-нибудь может дать простой сравнительный анализ этих поисковых систем?Какие преимущества имеет какая-либо из этих структур?

Кстати, я видел следующие основные объяснения выбора mg4j из нескольких научных работ:

  • , комбинируя индексы надта же коллекция
  • многоиндексные запросы

Обновление:

Эти слайды (из mir2ed.org ) содержит более свежий обзор поисковых систем с открытым исходным кодом, включая Lucene и mg4j, по сравнительному анализу различных аспектов: памяти и процессора, размера индекса, производительности поиска, качества поиска и т. д.

1 Ответ

3 голосов
/ 17 февраля 2011

Джефф Далтон рассмотрел многие поисковые системы с открытым исходным кодом , включая Lucene и mg4j, в 2007 году и обновил сравнение в 2009 году.

Я не использовал mg4j. Я использовал Lucene, хотя. Особенностью номер один Lucene IMO является его широкое распространение и замечательное сообщество пользователей / разработчиков / коммиттеров. Это означает, что есть большая вероятность, что кто-то работал над сценарием использования, аналогичным вашему, используя Lucene. Недостатками Lucene в настоящее время являются его модель начисления баллов и возможность масштабирования до больших коллекций текста. Разработчики Lucene работают над этими проблемами.

Я считаю, что выбор библиотеки поиска очень зависит от ваших (академических или промышленных) настроек, других частей вашего приложения и вашего варианта использования.

...