Я думаю, что не понимаю искры. У меня есть таблица, разделенная на «partition_date», может быть, около 10 разделов, но с большим количеством записей внутри каждого.
Когда я пытаюсь найти максимум этого поля, почему спарк оценивает все записи в таблице, если знает, что это поле раздела. Интуитивно понятно, что он только оценит эти 10 строк поля раздела и вернет максимум.
Я сделал быстрый подход с использованием 'show partitions', но меня интересует это поведение,
Большое спасибо.