В рамках моей работы мы ежегодно получаем файлы журналов объемом около 25 ТБ, в настоящее время они сохраняются в файловой системе на основе NFS. Некоторые архивируются как в zip / tar.gz, а другие находятся в чистом текстовом формате.
Я ищу альтернативы использованию системы на основе NFS. Я посмотрел на MongoDB, CouchDB. Тот факт, что они являются документно-ориентированной базой данных, кажется, делает ее подходящей. Однако содержимое файлов журнала должно быть изменено на JSON для хранения в БД. Что-то, чего я не желаю делать. Мне нужно сохранить содержимое файлов журнала как есть.
Что касается использования, мы намереваемся установить небольшой REST API и позволить людям получать список файлов, последние файлы и возможность получить файл.
Предлагаемые решения / идеи должны представлять собой некоторую форму распределенной базы данных или файловой системы на уровне приложений, где можно хранить файлы журналов и эффективно масштабировать по горизонтали, добавляя больше машин.
Анкур