reduce
: функция принимает накопленное значение и следующее значение, чтобы найти некоторую агрегацию.
reduceByKey
: тоже самое с указанным ключом.
reduceGroups
: применить указанную операцию к сгруппированным данным.
Я не знаю, как память управляла этими операциями.Например, как данные берутся при использовании функции reduce
(например, все данные загружаются в память?)?Я хочу знать, как данные управляются для сокращения операций.Я также хочу знать, в чем разница между этими операциями в соответствии с управлением данными.