Lucene (и большинство баз данных nosql) не является реляционной базой данных - поэтому даже если вы используете тривиальный ORM, вы столкнетесь с трудностями, пытаясь построить даже довольно тривиальное приложение исключительно вокруг Lucene.
Так что я бы предположил, что нет способа избежать использования mysql для основных данных.
(2 миллиона записей - это НЕ ОГРОМНОЕ количество данных)
Таким образом, возникает вопрос, стоит ли усилий по созданию метода для публикации данных из MySQL в Lucene. Имейте в виду, что MySQL предлагает готовую полнотекстовую индексацию и репликацию из коробки, и есть надстройки, такие как sphinx , специально разработанные для устранения недостатков стандартного решения.
Это покрывает многие из тех же вопросов, что и «связанные» вопросы, которые я вижу на моем экране в настоящее время - я предлагаю вам взглянуть на ответы - особенно этот