Действия в Spark возвращают
Ничего (None
в PySpark, void
в Java, Unit
в Scala) для действий, используемых исключительно для побочных эффектов, таких как foreach
.
Локальный, нераспределенный объект для других действий.
В то же время действия не влияют на неизменяемые объекты или объекты, которые существуют.вызывается (за исключением возможных побочных эффектов кэширования, контрольных точек, кэширования файлов в случайном порядке и вычислительной статистики).
Поэтому разделение здесь не имеет смысла.
Результаты не являются распределенными структурами данных Spark, поэтомуразбиение не применяется, источники не изменяются (и в любом случае являются описаниями, а не контейнерами).