В большинстве случаев оптимизатор spark должен быть достаточно умным, чтобы загружать только необходимые столбцы ( проекция с уменьшением ).Это особенно полезно для столбчатых форматов файлов, таких как паркет, это означает, что нужно читать не весь файл (ы).
Но я думаю, что в некоторых случаях все же лучше сделать явное выражение select
Я думаю, я видел случаи, когда нажатие на проекцию не работало достаточно хорошо, в основном в очень сложных запросах.
Чтобы быть уверенным, используйте искры df.explain