Если вы читаете из паркета, вы можете использовать infer_divisions=True
, как в этом примере
import dask.dataframe as dd
df = dd.read_parquet("file.parq", infer_divisions=True)
В случае необходимости вы можете напрямую установить индекс при чтении
df = dd.read_parquet("file.parq", index="my_col",
infer_divisions=True)