У меня ужасно долгое задание для чтения в наборе данных, который имеет естественный логический раздел в штате США. Я сохранил его как набор данных с разбитым паркетом из панд с помощью fastparquet (используя pd.write_parquet).
Я хочу, чтобы мой собеседник мог читать только в одном разделе (состоянии) из созданной папки паркета. read_parquet не имеет возможности фильтра. есть идеи?