Джефф Далтон рассмотрел многие поисковые системы с открытым исходным кодом , включая Lucene и mg4j, в 2007 году и обновил сравнение в 2009 году.
Я не использовал mg4j. Я использовал Lucene, хотя. Особенностью номер один Lucene IMO является его широкое распространение и замечательное сообщество пользователей / разработчиков / коммиттеров. Это означает, что есть большая вероятность, что кто-то работал над сценарием использования, аналогичным вашему, используя Lucene.
Недостатками Lucene в настоящее время являются его модель начисления баллов и возможность масштабирования до больших коллекций текста. Разработчики Lucene работают над этими проблемами.
Я считаю, что выбор библиотеки поиска очень зависит от ваших (академических или промышленных) настроек, других частей вашего приложения и вашего варианта использования.