Я сохраняю dataFrame, и в интерфейсе spark я вижу, что этот dataframe разделен на мои 7 узлов.
В моей искровой работе есть преобразования с широкими зависимостями.
Может ли быть более производительным заставить кеш только в 1 разделе?
Чтобы избежать перемешивания?
Спасибо