Nodejs - 'parquetjs' - неверная кодировка - PullRequest
0 голосов
/ 04 марта 2019

Я использую parquetjs модуль узла для чтения файлов паркета.

Если файл паркета прост - например, создан с помощью Python как:

import pandas as pd 
import snappy
import fastparquet

df = pd.DataFrame(
    data = {
        'col1': [1, 2, 3], 
        'col2': [3, 4, 5]
    }
)

df.to_parquet('df.snap.parquet', compression='snappy')

А затем попробуйте прочитать его с помощьюparquet.ParquetReader.openFile(filename) ... получая ошибку:

invalid encoding: PLAIN_DICTIONARY

Если файл паркета создается как сложный объект - он читает это нормально.В чем может быть проблема?(Python может читать этот файл без проблем) ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...