Вы смотрели на Berkeley DB Java Edition ? Это было разработано для этого типа использования в виду. Большие наборы данных, высокая пропускная способность записи, надежное сохранение с набором API-интерфейсов, очень дружественных для Java-разработчиков. Вы можете использовать Base API (пары ключ / значение) , Collections API или JPA-подобный DPL (Direct Persistence Layer) API.
Есть отличное Руководство по началу работы , которое содержит примеры и объясняет различные API.
Есть много подобных вариантов использования вашего. На самом деле, Terracotta и Coherence оба используют Berkeley DB для постоянства. Как и Heretix, проект интернет-архива, Tibco и многие другие компании и проекты. Причина в том, что BDB обеспечивает необходимую производительность, надежность, масштабируемость, гибкость и простоту.
Отказ от ответственности: я один из менеджеров по продуктам в Berkeley DB, поэтому, естественно, я предвзят. Но ваш вариант использования звучит точно в соответствии с тем, для чего был разработан BDB.
Удачи в вашем проекте. Пожалуйста, дайте нам знать, если есть что-то, с чем мы можем помочь. Вы можете задать вопросы о Berkeley DB Java Edition на форумах OTN , где вы найдете большое сообщество активных разработчиков приложений Java.
С уважением,
Dave