Я столкнулся со сценарием, в котором у меня был набор искровых данных с 24 столбцами, из которых я группировал по первым 22 столбцам и суммировал последние два столбца.
Я удалил группу из запроса, и у меня естьвсе 24 столбца выбраны сейчас.Первоначальное число наборов данных было 79 304.
После того, как я удалил группу, счет увеличился до 138 204, что понятно, потому что я удалил группу с помощью.
Но мне было непонятно с поведениемчто первоначальный размер файла паркета был 2,3 МБ , но позже он был уменьшен до 1,5 МБ .Может кто-нибудь, пожалуйста, помогите мне понять это.
Также не каждый раз, когда размер уменьшается, у меня был похожий сценарий для подсчета 22 столбцов, до того как было 35 298 226, а после удаления группы было 59 874 208, и здесь размер увеличился с 466,5 МБ до 509.8MB