spark.serializer используется при работе с СДР и используется для перетасовки данных между рабочим, контрольных точек, сериализации СДР на диск и т. д.
DataFrame имеет собственное столбцовое хранилище для кэширования.Следовательно spark.serializer не оказывает никакого влияния вообще.
Spark использует spark.closure.serializer используется для сериализации переменной закрытия и широковещательной передачи, которая является JavaSerializer.
Чтобы ответить на вашОчки
Да.Поскольку Dataframe использует свое собственное столбцовое хранилище для кэширования.Следовательно spark.serializer не оказывает влияния.
Нет.Для закрытия и трансляции переменных сериализации используется closureSerializer в spark.closure.serializer , который является JavaSerializer .