Я создаю искровой контекст и сессию в своем коде PySpark следующим образом:
conf = SparkConf().set("spark.cleaner.referenceTracking.cleanCheckpoints", "true")
sc = SparkContext.getOrCreate(conf=conf)
spark = SparkSession(sc)
spark.sparkContext.setCheckpointDir("../../checkpoints")
В следующем коде я использую checkpoint()
на некоторых фреймах данных. Это работает, как и ожидалось.
Но я хочу удалить контрольные точки после того, как код будет выполнен до завершения.
Можно ли использовать конфигурацию свечи? cleanCheckpoints
этого не делает.
Как я могу удалить эти файлы контрольных точек после завершения кода? Каков наилучший подход?