Spark является энергозависимым хранилищем, т.е. хранит всю оперативную память. Пока данные не находятся в памяти, вы можете запрашивать данные, используя API Spark или SQL. Все данные необходимо перезагрузить обратно с заданием Spark.
Для сохранения сохранности вы также можете сохранить свои Spark Dataframes в виде файлов паркета на постоянном диске и запросить их по Spark или кусту.