Вот понятия
В Spark Transformation определяет, где один RDD генерирует один или несколько RDD.Каждый раз, когда создается новый СДР.СДР являются неизменяемыми, поэтому любое преобразование на одном СДР генерирует новый СДР и добавляется в DAG.
Действие в искре - это функция, при которой новые СДР не генерируются, генерируются другие типы данных, такие как String, int и т. Д., И результатвозвращается в драйвер или другую систему хранения.
Преобразования имеют ленивый характер и ничего не происходит до тех пор, пока не будет запущено действие.
reduByKey - это преобразование, поскольку оно генерирует RDD из входного RDD и его aШИРОКАЯ ТРАНСФОРМАЦИЯ.При уменьшении по ключу ничего не происходит, пока не сработаетСм. Изображение ниже

уменьшите - это действие, поскольку оно генерирует тип не RDD.Пожалуйста, смотрите изображение ниже
