Написание индексатора с использованием языка программирования, с которым вы знакомы и который использует часть доступных файлов, вероятно, является лучшим выбором, тогда как запуск нескольких копий этого индексатора (или использование нескольких потоков, если это легко доступно) - позволяет вамотправляйте контент параллельно и с нескольких серверов, если это необходимо.
Не используйте явные коммиты в каждом клиенте - используйте commitWithin, чтобы вы фиксировали только каждые 60 секунд (или 10 минут, или ... любой интервал, который вам подходит).