Предикат относится к предложению where / filter, которое влияет на количество возвращаемых строк.
Проекция относится к выбранным столбцам.
Например:
Если ваши фильтрыпропустите только 5% строк, только 5% таблицы будут переданы из хранилища в Spark вместо полной таблицы.
Если ваша проекция выберет только 3 столбца из 10, то будет меньше столбцовпередается из хранилища в Spark, и если ваше хранилище является столбчатым (например, Parquet, а не Avro), а невыбранные столбцы не являются частью фильтра, то эти столбцы даже не нужно читать.