Файл паркета недоступен для записи после первого чтения с использованием PyArrow - PullRequest
0 голосов
/ 21 мая 2018

Я пытаюсь прочитать файл паркета в pandas dataframe, выполнить некоторые манипуляции и записать его обратно в тот же файл, однако кажется, что файл недоступен для записи после первого чтения в той же функции.

Это работает, только если я не выполню ШАГ 1 ниже.Есть ли вообще разблокировать файл как таковой?

#STEP 1: Read entire parquet file
pq_file = pq.ParquetFile('\dev\abc.parquet')
exp_df = pq_file.read(nthreads=1, use_pandas_metadata=True).to_pandas()

#STEP 2: 
# Change some data in dataframe

#STEP 3: write merged dataframe
pyarrow_table = pa.Table.from_pandas(exp_df)
pq.write_table(pyarrow_table, '\dev\abc.parquet',compression='none',)

Ошибка:

File "C:\Python36\lib\site-packages\pyarrow\parquet.py", line 943, in 
write_table
**kwargs)
File "C:\Python36\lib\site-packages\pyarrow\parquet.py", line 286, in 
__init__
**options)
File "_parquet.pyx", line 832, in pyarrow._parquet.ParquetWriter.__cinit__
File "error.pxi", line 79, in pyarrow.lib.check_status
pyarrow.lib.ArrowIOError: Failed to open local file: \dev\abc.parquet , 
error: Invalid argument
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...