Чтение панд DataFrame с категориальными столбцами из файла HDF с «где» - PullRequest
0 голосов
/ 03 октября 2018

Как правильно читать DataFrame pandas с категоричными столбцами из файла HDF с аргументом 'where'?

Вот что я вижу:

>>> import pandas as pd
>>> d = pd.read_hdf(path, columns={'ex'}, where='(ex in ["LN","GY","FP"])')
>>> d['ex'].unique()
[LN, ID]
Categories (2, object): [LN, ID]

Почему я получаюданные с d['ex']=='ID', если я специально спросил только ["LN","GY","FP"] значения?Как мне сделать это правильно?

За те же данные, сохраненные без преобразования данных в Категориальные, я получаю:

>>> import pandas as pd
>>> d = pd.read_hdf(path, columns={'ex'}, where='(ex in ["LN","GY","FP"])')
>>> d['ex'].unique()
array(['LN'], dtype=object)

Спасибо за вашу помощь!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...