Даже если вы не учитываете производительность, эти два подхода не дадут одинаковых результатов. Если у вас есть один документ, первая строка которого - «лиса», а вторая - «собака», и если вы ищете «лиса» И «собака», при втором подходе результатов не будет.
Что касается вашего второго вопроса, нет, вам не нужно выполнять токенизацию перед созданием документов и полей. Токенизация будет выполняться при вызове IndexWriter # add (Document).
Если вы только начинаете работать с Lucene, я настоятельно рекомендую вам прочитать демонстрационный код . Это покажет вам, как создать, а затем выполнить поиск по индексу Lucene.
И если скорость индексирования имеет решающее значение для разрабатываемого вами приложения, на Lucene wiki .
есть очень хорошие советы.