Я использую pix2pix cGAN в python. Предполагается сохранять каждые 10 эпох модель. Это работало в течение дня или двух, и затем внезапно застревает, спасая модель. Перезагрузка компьютера, кажется, помогает для запуска или двух, но затем та же самая вещь случается снова .. Это очевидно что-то связанное с нехваткой памяти, но я не могу найти подобную проблему нигде или как исправить это. Я обновил h5py. Некоторые из других ошибок, возникающих в восходящем потоке, передаются в h5py:
Файл "H: \ PatchGAN \ Pix2PixGAN.py", строка 209, в резюмируемой сумме gpermomance.save (имя файла 2)
Файл "C: \ Users \ LBuchanan \ AppData \ Local \ Continuum \ anaconda3 \ envs \ DeepLearningGPU2 \ lib \ site-packages \ keras \ engine \ topology.py", строка 2580, в файле save save_model (self, filepath) , перезаписать, include_optimizer)
Файл "C: \ Users \ LBuchanan \ AppData \ Local \ Continuum \ anaconda3 \ envs \ DeepLearningGPU2 \ lib \ site-packages \ keras \ models.py", строка 119, в save_model topology.save_weights_to_hdf5_group (model_weights_group, model_layers)
Файл "C: \ Users \ LBuchanan \ AppData \ Local \ Continuum \ anaconda3 \ envs \ DeepLearningGPU2 \ lib \ site-packages \ top \ engine .py ", строка 2967, в save_weights_to_hdf5_group param_dset [:] = val
Файл" h5py_objects.pyx ", строка 54, в h5py._objects.with_phil.wrapper
Файл" h5py_objects.pyx ", строка 55, в h5py._objects.with_phil.wrapper
Файл "C: \ Users \ LBuchanan \ AppData \ Local \ Continuum \ anaconda3 \ envs \ DeepLearningGPU2 \ lib \ site-packages \ h5py_hl \ dataset.py", строка 708, в setitem self .id.write (mspace, fspace, val, mtype, dxpl = self._dxpl)
Файл "h5py_objects.pyx", строка 54, в файле h5py._objects.with_phil.wrapper
Файл «h5py_objects.pyx», строка 55, в файле h5py._objects.with_phil.wrapper
Файл «h5py \ h5d.pyx», строка 222, в файле h5py.h5d.DatasetID.write
«h5py_proxy.pyx», строка 132, в h5py._proxy.dset_rw
Файл «h5py_proxy.pyx», строка 93, в h5py._proxy.H5PY_H5Dwrite
OSError: невозможно записать данные (ошибка записи в файл: время = вторник, 4 февраля 13:35:17 2020, имя файла = 'model_005040.h5', дескриптор файла = 6, номер ошибки = 22, сообщение об ошибке = 'неверный аргумент', buf = 0000000205200000, общий размер записи = 33554432, байты этой подзаписи = 33554432, фактически записанные байты = 18446744073709551615, смещение = 95057216)