Question

Как правильно читать DataFrame pandas с категоричными столбцами из файла HDF с аргументом 'where'?

Вот что я вижу:

>>> import pandas as pd
>>> d = pd.read_hdf(path, columns={'ex'}, where='(ex in ["LN","GY","FP"])')
>>> d['ex'].unique()
[LN, ID]
Categories (2, object): [LN, ID]

Почему я получаюданные с d['ex']=='ID', если я специально спросил только ["LN","GY","FP"] значения?Как мне сделать это правильно?

За те же данные, сохраненные без преобразования данных в Категориальные, я получаю:

>>> import pandas as pd
>>> d = pd.read_hdf(path, columns={'ex'}, where='(ex in ["LN","GY","FP"])')
>>> d['ex'].unique()
array(['LN'], dtype=object)

Спасибо за вашу помощь!

Чтение панд DataFrame с категориальными столбцами из файла HDF с «где»

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Чтение панд DataFrame с категориальными столбцами из файла HDF с «где»

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы