Я знаю, что метод Apache Spark persist сохраняет RDD в памяти и что, если не хватает места в памяти, он сохраняет оставшиеся разделы RDD в файловой системе (диске),Кажется, я не могу понять следующее:
Представьте, что у нас есть кластер, и мы хотим сохранить СДР.Предположим, что у узла A недостаточно места в памяти, а у узла B - много.Предположим теперь, что после выполнения команды persist узлу A не хватает памяти.Теперь возникает вопрос:
Ищет ли Apache Spark больше места в памяти узла B и пытается ли хранить все в памяти?
Или, учитывая, что в узле A недостаточно места, Spark хранитоставшиеся разделы СДР на диске узла A, даже если в узле B доступно некоторое пространство памяти?
Спасибо за ваши ответы.