Предположим, что файл Parquet имеет> 2 столбца, и у меня есть фильтр на 2 из столбцов, таких как:
col1> 10 && col2 <100 </p>
Нужно ли мне писать логику для обхода блоков групп столбцов, проверки минимальных и максимальных значений и получения соответствующих данных?
Или в Apache Arrow / Parquet есть API, который бы абстрагировал часть этой работы?
Спасибо,
Marc