Как получить количество строк набора данных ParquetDatset, структурированного в виде папки, содержащей несколько файлов паркета.
Я попытался
from pyarrow.parquet import ParquetDataset
a = ParquetDataset(path)
a.metadata
a.schema
a.commmon_metadata
Я хочу выяснить, общее количество строк без чтения набора данных, поскольку оно может быть довольно большим.
Какой лучший способ сделать это?