cache
- это удобный метод для кэширования данных. Persist
- это расширенный метод, который может принимать уровень хранилища в качестве параметра и соответственно сохранять фрейм данных.
Уровень хранения по умолчанию для cache
и persist
одинаков и, как вы упомянули, дублирован. Вы можете использовать либо. В Scala реализации cache
звонки persist
def cache(): this.type = persist()
. Это говорит мне о том, что persist
является реальной реализацией, а cache
является синтаксисом сахара.