Question

Можно ли с помощью аргумента 'where' функции 'read_hdf' выбрать подмножество строк в DataFrame панд, записанных в файл HDF5, только тех, у которых строковые значения столбца заканчиваются каким-либо выражением?

Например:

import pandas as pd, os
t = pd.DataFrame(data={'i1':['AA','AB','BA','BB'], 
                       'i2':[0,1,2,3], 
                       'x':[0.,2.,2.,3.]})
t.set_index(['i1','i2'], inplace=True)
t.sort_index(inplace=True)
path = os.path.join(os.environ['HOME'], 'temp/temp.h5')
t.to_hdf(path, 't', format='table')

# attempt to select rows where 'i1' ends with "A"
t2 = pd.read_hdf(path, where='i1[-1:]=="A"')
t2 = pd.read_hdf(path, where='i1=="*A"')

Я предполагаю, что решение будет использовать каким-то образом действительный PyTables Expr как 'где'.

Спасибо за вашу помощь!

pandas read_hdf, где значения строковых столбцов заканчиваются выражением

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

pandas read_hdf, где значения строковых столбцов заканчиваются выражением

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы