Уменьшение размера данных - PullRequest
0 голосов
/ 12 февраля 2019

Недавно мы выполнили задачу по переносу тысяч статических PDF-файлов, которые раньше хранились в eXist-db, в хранилище в Amazon S3.Все эти файлы теперь извлекаются через приложение, которое указывает на Amazon S3, а не на базу данных. База данных используется для создания информации, которую нужно извлечь.

Итак, мы удалили все эти файлы из базы данных.Мы удалили файлы, которые составляли бы около 60% (возможно, ближе к 80%) размера всей базы данных.

Поскольку фактическая БД ежедневно реплицируется в несколько стран, мы надеялись, что это уменьшит размервсе файлы базы данных значительно.

Без изменений.Это ожидается?Или какие шаги необходимо выполнить, чтобы действительно освободить это пространство?

Мы пробовали, останавливались и запускались ... мы также пробовали резервное копирование (теперь пустые коллекции) и восстановление только тех коллекций, которые думали, что это вызовет события.Ни один не работал.

Есть ли (когда-либо) какой-нибудь способ исправить это?Нужно ли нам делать резервное копирование всей БД и восстанавливать ее во что-то чистое?

Обновление I

ОК, глядя на структуры каталогов двух разных установок, которые практически идентичныКроме PDF-файлов ...

Размер удаленных PDF-файлов на 10 МБ больше, чем у удаленных PDF-файлов.При проверке каталога / fs PDF-файлы и итоговые суммы суммированных PDF-файлов коллекции были удалены приблизительно из 800 МБ.

Таким образом, мы удалили 800 МБ из базы данных (каталог / fs на 800 МБ меньше).Но общий размер увеличивается на 10 МБ.

Вышеприведенные предположения неверны, поскольку общий каталог составляет около 2,4 ГБ, поэтому 800 МБ - это не 60%, а меньше.

Но все же я ожидаючто если я удалю 800 МБ данных из базы данных, произойдет некоторое уменьшение размера, и, конечно, увеличение не составит 10 МБ.

Обновление II

Так как коллекции удаленыу меня не было содержимого, я создал простой XML-файл и поместил его в каждую коллекцию.Я сделал резервную копию этих двух коллекций и восстановил с (теперь) почти пустыми коллекциями.

Это ничего не сделало.

Так что кажется (догадываясь) только целое резервное копирование / восстановление БДсделаю что угодно.

...