Я использую parquetjs
модуль узла для чтения файлов паркета.
Если файл паркета прост - например, создан с помощью Python как:
import pandas as pd
import snappy
import fastparquet
df = pd.DataFrame(
data = {
'col1': [1, 2, 3],
'col2': [3, 4, 5]
}
)
df.to_parquet('df.snap.parquet', compression='snappy')
А затем попробуйте прочитать его с помощьюparquet.ParquetReader.openFile(filename)
... получая ошибку:
invalid encoding: PLAIN_DICTIONARY
Если файл паркета создается как сложный объект - он читает это нормально.В чем может быть проблема?(Python может читать этот файл без проблем) ...