Я пытаюсь прочитать секционированный набор данных в aws s3, это выглядит так:
MyDirectory--code=1--file.parquet
--code=2--another.parquet
--code=3--another.parquet
Я создал file_list, содержащий путь ко всем файлам в каталоге, затем выполнил
df = pq.ParquetDataset(file_list, filesystem=fs).read().to_pandas()
все работает, за исключением того, что в столбце данных df отсутствует код столбца раздела. я попробовал это также, используя один путь к MyDirectory, зашедшему из file_list, но обнаружил ошибку «Найдены файлы в промежуточном каталоге: s3: // bucket / Mydirectoty», я не могу найти никакого ответа в Интернете.
Спасибо вы!