Python Pandas для конвертации CSV в паркет с помощью Fastparquet - PullRequest
0 голосов
/ 12 февраля 2019

Я использую интерпретатор Python 3.6 в моем PyCharm venv и пытаюсь преобразовать CSV в Parquet.

import pandas as pd    
df = pd.read_csv('/parquet/drivers.csv')
df.to_parquet('output.parquet')

Error-1 ImportError: Невозможно найти работающий движок;пробовал использовать: "pyarrow", "fastparquet".Для поддержки паркета требуется pyarrow или fastparquet

Solution-1 Установлен fastparquet 0.2.1

Ошибка-2 Файл "/ Users / python parquet/venv/lib/python3.6/site-packages/fastparquet/compression.py ", строка 131, в compress_data (алгоритм, отсортирован (сжатия))) RuntimeError: Сжатие 'snappy' недоступно.Опции: ['GZIP', 'UNCOMPRESSED']

Я установил python-snappy 0.5.3 , но все еще получаю ту же ошибку?Нужно ли устанавливать какую-либо другую библиотеку?

Если я использую движок PyArrow 0.12.0 , проблема не возникает.

...