У меня есть небольшой скрипт, предназначенный для чтения CSV-файлов из пользовательского каталога ввода и преобразования их в один файл HDF5:
path = input('Insert the directory path:')
file_list = []
for file in glob.glob(path):
file_list.append(file)
for filename in file_list:
df = pd.read_csv(filename)
key = Path(filename).resolve().stem
with pd.HDFStore('test.h5') as store:
store.append(key=key, value=df, format='table', data_columns=df.columns)
В настоящее время выполняется добавление каждого файла (в формате данных) как группа. Если я открою его в vitables, он будет выглядеть примерно так:
Кроме того, если я снова запустите скрипт, используя другой каталог, он продолжит добавлять новые групп (по одной для каждого файла) в группу root.
Что бы мне хотелось, чтобы каждый раз, когда я запускаю скрипт, он добавляет группы файлов в новую группу (тему) в root. Примерно так:
![enter image description here](https://i.stack.imgur.com/t7SuC.png)
Мне кажется, это как-то связано с ключами, которые я передаю в store.append
, потому что сейчас он использует имя файла в качестве ключа. Мне удалось вручную передать ключи и добавить нужный кадр данных, но это не конечная цель, которую я хотел.
Несколько советов было бы здорово! Спасибо