Я нашел этот тестовый пример в хранилище кода:
test("cache, getStorageLevel") {
// test to see if getStorageLevel returns correct value after caching
withSpark { sc =>
val verts = sc.parallelize(List((0L, 0), (1L, 1), (1L, 2), (2L, 3), (2L, 3), (2L, 3)))
val edges = EdgeRDD.fromEdges(sc.parallelize(List.empty[Edge[Int]]))
assert(edges.getStorageLevel == StorageLevel.NONE)
edges.cache()
assert(edges.getStorageLevel == StorageLevel.MEMORY_ONLY)
}
}
StorageLevel.NONE аналогичен отсутствию кэширования. Насколько я знаю, некэшированный RDD будет пересчитываться каждый раз в зависимости от потока данных RDD. Это кажется полезным для целей тестирования и для кэширования RDD.