Как правильно читать DataFrame pandas с категоричными столбцами из файла HDF с аргументом 'where'?
Вот что я вижу:
>>> import pandas as pd
>>> d = pd.read_hdf(path, columns={'ex'}, where='(ex in ["LN","GY","FP"])')
>>> d['ex'].unique()
[LN, ID]
Categories (2, object): [LN, ID]
Почему я получаюданные с d['ex']=='ID'
, если я специально спросил только ["LN","GY","FP"]
значения?Как мне сделать это правильно?
За те же данные, сохраненные без преобразования данных в Категориальные, я получаю:
>>> import pandas as pd
>>> d = pd.read_hdf(path, columns={'ex'}, where='(ex in ["LN","GY","FP"])')
>>> d['ex'].unique()
array(['LN'], dtype=object)
Спасибо за вашу помощь!