Я пытаюсь настроить политику хранения для создаваемых таблиц Databricks, но я не знаю, как это сделать. Я использую эти две конфигурации на основе документации Databricks:
delta.logRetentionDuration = "interval": укажите, сколько времени вы можете go вернуться во времени. По умолчанию используется интервал 30 дней.
delta.deletedFileRetentionDuration = "интервал": настройка времени хранения устаревших файлов данных перед удалением с помощью
VACUUM. По умолчанию используется интервал 1 неделя.
Моей таблице не менее 2 дней, и использование интервала в 1 день неэффективно, потому что я запрашиваю таблицу, и каждая строка все еще там, ничего не удалено Я также использовал команду VACUUM следующим образом:
VACUUM test_table RETAIN 10 ЧАСОВ
Но, тем не менее, ничего не удалено.