Я пытаюсь прочитать файл h5py, в нем есть несколько наборов данных, и я могу легко их прочитать, но есть один, в котором я сталкиваюсь с одной проблемой с типом данных, как <HDF5 dataset "word_key": shape (1,), type "|V15060">
и его кортеж (dataset[0][0]
, dataset[0][1]
).
Проблема: меня интересует только dataset[0][1]
, который содержит список слов, и во время чтения я получаю только 7 символов для каждого слова, не более того. Скажем, данные имеют ['elephant','umbrella']
мой код читает ['elephan','umbrell']
. Вот мой код, любое решение относительно того, как изменить размер блока чтения.
код
with h5py.File('C:/dataset.h5','r') as hdf:
data=hdf.get('word_key')
print(data)
dataset=np.array(data)[0][1]
word_dic={}
for val, word in enumerate(dataset[0][1],0):
if len(word.decode('UTF-8'))==7:
print(word.decode('UTF-8'))
word_dic[val]=word.decode('UTF-8')