Мы знаем, что куст не выполняет выборку до начала задания сортировки. Он просто использует механизм сортировки MapReduce и выполняет сортировку слиянием на стороне сокращения, и используется только одно сокращение. В этом сценарии, скажем, на машине, на которой выполняется Reduce, есть только диск объемом 100 ГБ, что если данные слишком велики, чтобы поместиться на диск?