Я не уверен на 100%, что вы имеете в виду, но в целом (я думаю), у вас есть паркетный раздел на ключах разделов и вы сохраняете столбцы в блоки строк. Когда я использовал в нем AWS S3, он сохранил как:
|-Folder
|--Partition Keys
|---Columns
|----Rows_1-100.snappy.parquet
|----Rows_101-200.snappy.parquet
Это обрабатывает эффективность расщепления, которую вы упомянули.