Question

Я использую parquetjs модуль узла для чтения файлов паркета.

Если файл паркета прост - например, создан с помощью Python как:

import pandas as pd 
import snappy
import fastparquet

df = pd.DataFrame(
    data = {
        'col1': [1, 2, 3], 
        'col2': [3, 4, 5]
    }
)

df.to_parquet('df.snap.parquet', compression='snappy')

А затем попробуйте прочитать его с помощьюparquet.ParquetReader.openFile(filename) ... получая ошибку:

invalid encoding: PLAIN_DICTIONARY

Если файл паркета создается как сложный объект - он читает это нормально.В чем может быть проблема?(Python может читать этот файл без проблем) ...

Nodejs - 'parquetjs' - неверная кодировка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Nodejs - 'parquetjs' - неверная кодировка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы