Невозможно прочитать файл паркета с помощью fastparquet, но работает с пустыми строчками - PullRequest
1 голос
/ 04 июня 2019

В настоящее время выполняется некоторый код, подобный следующему:

df = pd.read_parquet('/tmp/my-file.parquet', engine='pyarrow')

У меня были проблемы с использованием памяти, так как файлы велики, поэтому я хотел выяснить, будет ли fastparquet работать лучше для использования памяти.

Когда я переключаю двигатель:

df = pd.read_parquet('/tmp/my-file.parquet', engine='fastparquet')

Эта строка теперь выдает ошибку, подобную этой:

TypeError: int() argument must be a string, a bytes-like object or a number, not 'NoneType'

Я полагаю, что это происходит, потому что у меня есть целочисленное поле, которое содержит нули.Я не могу найти документацию, которая говорит, что это не поддерживается.

Любые идеи о том, почему это происходит или как обойти это, все еще используя fastparquet?

...