В h5py какой тип "| V15060" - PullRequest
       8

В h5py какой тип "| V15060"

0 голосов
/ 06 января 2019

Я пытаюсь прочитать файл h5py, в нем есть несколько наборов данных, и я могу легко их прочитать, но есть один, в котором я сталкиваюсь с одной проблемой с типом данных, как <HDF5 dataset "word_key": shape (1,), type "|V15060"> и его кортеж (dataset[0][0], dataset[0][1]).

Проблема: меня интересует только dataset[0][1], который содержит список слов, и во время чтения я получаю только 7 символов для каждого слова, не более того. Скажем, данные имеют ['elephant','umbrella'] мой код читает ['elephan','umbrell']. Вот мой код, любое решение относительно того, как изменить размер блока чтения.

код

with h5py.File('C:/dataset.h5','r') as hdf:
    data=hdf.get('word_key') 
    print(data)
    dataset=np.array(data)[0][1]
    word_dic={}
    for val, word in enumerate(dataset[0][1],0):
        if len(word.decode('UTF-8'))==7: 
               print(word.decode('UTF-8'))
        word_dic[val]=word.decode('UTF-8')
...