Например, у меня есть набор данных, похожий на этот:
dataset
├── a=1
│ └── 1.parquet
├── a=2
│ └── 2.parquet
├── a=3
└── 3.parquet
, и он загружается как dataset = pyarrow.parquet.ParquetDataset('./dataset')
Как запросить доступные записи раздела "a
", не читая весь набор данныхв память?Благодаря ~