Я планирую разработать серверное приложение для поддержки и обработки миграции объемных данных.
Представьте себе, что это платформа на основе очередей, где клиентская программа (исходные агенты, которые извлекают метаданные из системы управления контентом) будет отправлять пакеты данных (размером приблизительно 1 КБ) на сервер, и сервер будет хранить эти пакеты в своей назначенной файловой системе.
Сервер будет классифицировать пакет данных на основе некоторой информации заголовка из пакета данных и должен иметь возможность извлекать и возвращать соответствующий пакет данных, когда он запрашивается с использованием некоторой информации заголовка.
Мы можем легко выполнить это со стандартной СУБД, если метаданные правильно определены, но в моем случае информация заголовка пакета будет меняться с течением времени, и я не хочу часто пересматривать свою базу данных.
Задача, которую я вижу здесь, заключается в том, чтобы эффективно хранить файлы пакетов в файловой системе (чтобы это не влияло на производительность файлового сервера), а также поддерживать информацию индексации, которая может использоваться для определения местоположения соответствующих пакетов при запросе.
Я подумываю об использовании любой инфраструктуры с открытым исходным кодом, не относящейся к СУБД (основанной на Java - nosql ??), которая может служить вышеуказанной цели. Количество пакетов может варьироваться от нескольких тысяч до нескольких миллионов в зависимости от объема исходного хранилища.
Ценю ваш вклад.