pyarrow serialize pandas df с обнуляемым типом Integer - PullRequest
0 голосов
/ 18 февраля 2020

Я хотел бы использовать новые ntylable dtypes в pandas 1.0. У кого-нибудь был успех с сериализацией pd.DataFrame, содержащей столбец целых чисел, обнуляемых с помощью pyarrow?

Ресурсы, которые я использовал до сих пор, документированы в блоке кода. Буду признателен за любую оказанную помощь.

import pandas as pd
import pyarrow  # version 0.16
import pyarrow as pa

# workaround suggested in https://issues.apache.org/jira/browse/ARROW-5379
pd.arrays.IntegerArray.__arrow_array__ = lambda self, type: pyarrow.array(self._data, mask=self._mask, type=type)

df = pd.DataFrame([1, 2])
df = df.convert_dtypes()

# following https://arrow.apache.org/docs/python/ipc.html#serializing-pandas-objects
context = pa.default_serialization_context()
context.serialize(df)

Сообщение об ошибке

SerializationCallbackError: pyarrow does not know how to serialize objects of type <class 'pandas.core.arrays.integer.IntegerArray'>.
...