У меня есть pyarrow
код написания набора данных для паркета. Я хочу провести интеграционный тест, который гарантирует, что файл написан правильно. Я хотел бы сделать это, записав небольшой пример данных в файловую систему в памяти. Однако я изо всех сил пытаюсь найти pyarrow
-совместимый интерфейс файловой системы в памяти для Python.
Ниже вы найдете фрагмент кода с переменной filesystem
. Я хотел бы заменить переменную filesystem
файловой системой в памяти, которую я могу позже проверить программно в интеграционных тестах.
import pyarrow.parquet as pq
pq.write_to_dataset(
score_table,
root_path=AWS_ZEBRA_OUTPUT_S3_PREFIX,
filesystem=filesystem,
partition_cols=[
EQF_SNAPSHOT_YEAR_PARTITION,
EQF_SNAPSHOT_MONTH_PARTITION,
EQF_SNAPSHOT_DAY_PARTITION,
ZEBRA_COMPUTATION_TIMESTAMP
]
)