Недавно я попросил удалить несколько миллионов записей из общей суммы 14 ТБ данных Cosmos Db.
Когда я посмотрел в целое число rnet, я нашел хранимый про c для выполнения массовое удаление, и это работает на основе ключа раздела.
Мой сценарий состоит в том, что у нас есть 4 атрибута в каждом документе. 1. id 2. номер [ключ раздела] 3. начальная дата 4. конечная дата
Требуется удалить документы на основе начальной даты.
Удалить * из c, где c. startdate> = '' и c .startdate <= '' </p>
Приведенный выше запрос проходит через весь раздел и удаляет записи.
Я также проверил, выполнив запрос в Databricks для взять все записи CosmosDB во временном Dataframe и добавить атрибут TTL, а затем снова перенести в Cosmos DB.
Есть ли лучший способ добиться того же?