Почему два файла h5py различаются по размеру, если содержимое одинаковое? - PullRequest
0 голосов
/ 04 апреля 2020

В данный момент я очень озадачен и надеюсь, что кто-то здесь может мне помочь.

У меня есть файл h5py, предоставленный мне онлайн. Я знаю очень мало деталей, и я занимался обратным проектированием, как создается этот файл h5py. Он состоит из почти 200 тыс. Наборов данных с формой (x, 768), при этом x отличается для каждого набора данных.

Мне удалось перепроектировать, как создается этот файл, и иметь почти идентичный файл h5py. Я говорю почти идентично, потому что исходный файл h5py имеет размер 3,6 ГБ, а мой - 3,8 ГБ, но у них одинаковое количество наборов данных с одинаковыми именами, формами и типом данных. Почему размер отличается, когда файлы одинаковые?

Пожалуйста, дайте мне знать, если мне нужно предоставить более подробную информацию или какой-нибудь код. Я не уверен, что могу объяснить, что я имею в виду.

...