Сжатие набора данных в Apache Йена Фусеки - PullRequest
1 голос
/ 03 марта 2020

Здравствуйте, коллеги-энтузиасты RDF.

Я развернул сервер Jena Fuseki в качестве конечной точки для сбора большого количества данных о событиях, поступающих из инфраструктуры облачных сервисов, чтобы позже использовать набор данных в качестве основного источника знаний для интерфейс мониторинга сервиса. Но набор данных очень быстро увеличивается.

Я узнал, что есть способ сжать набор данных TDB2. Как мне это сделать из среды Fuseki?

1 Ответ

0 голосов
/ 11 марта 2020

Очевидно, что нет способа выполнить уплотнение онлайн из среды Fuseki. Однако я обнаружил, что ни одна из команд tdb.tdbcompact не сжимает базу данных в достаточной степени, поскольку в моем случае разница составляла где-то 2-4% от размера базы данных.

Вместо этого я делаю сброс весь набор данных, очистите базу данных и снова загрузите набор данных. Результат невероятен: от базы данных 50 ГиБ до 1 ГиБ.

Я запланировал это делать ежедневно вместе с резервными копиями.

...