Если все, что вам нужно, - это быстрое и постоянное хранилище значений ключей для не огромного набора данных, то Lucene, вероятно, не лучшее решение - Berkeley DB будет очевидным выбором.Тем не менее, Грант Ингерсолл выступил с докладом на конференции Lucene Revolution в этом году именно об этом.Он преднамеренно пришел к этому вопросу с предвзятым отношением к про-Lucene и начал обсуждать с несколькими участниками аудитории то, что современные базы данных документов (такие как CouchDB) предоставляют, что Lucene не делает.Для любого небольшого набора данных, который в конечном итоге может нуждаться во вторичных индексах, я думаю, что это отличное решение.Производительность Lucene для поиска по ключу / значению не будет такой высокой, как у Berkeley DB, CouchDB, Tokyo Tyrant и т. П., Но она все еще довольно быстрая, более чем достаточная для многих приложений.Я думаю, что он измерял примерно 50 мс для поиска ключа / значения на недавнем ноутбуке.И если позже вам понадобится добавить вторичные индексы (как это может показаться в результатах веб-сканирования), вам будет намного проще работать с Lucene, чем с этими продуктами.
Другие инструменты,как BDB, будет проще для кода, чем Lucene.Но если это проблема, просто используйте Solr, который упрощает добавление документов и поиск с помощью простых HTTP-вызовов (вам нужно изменить поля в конфигурационном файле schema.xml, но в противном случае Solr должен быть готов киспользовать из коробки).
Теперь, если ваш набор данных слишком велик для разумного размещения на одном компьютере, распределенные хранилища значений ключей, такие как Project Voldemort или Riak, могут быть проще в настройке и администрировании.Но Lucene поможет вам продвинуться далеко на одной машине, особенно если вы не индексируете много полей - по крайней мере, ТБ, я думаю.
Если вы используете Lucene, я бы задумался о том,действительно, нет никаких свойств, кроме ключа, по которому вы хотели бы искать, а также сохранить их в первый раз, так как Lucene облегчает это.