проблема с обучением StyleGan2 и формами наборов данных * .TFrecords - PullRequest
0 голосов
/ 16 июня 2020

Я новичок в углубленном обучении и python и начал практиковать в начале этого года. Я уже обучил PGGAN (постепенно растущий GAN Т.Карраса) на моем собственном наборе данных, преобразовав мои изображения в наборы файлов Tensorflow Datasets (файлы * .tfrecords), используя dataset_tool.py, поставляемый с PGGAN, и он работал как шарм. Однако я хотел обучить StyleGAN2 из NViLABS, используя те же наборы данных, так как он также работает с файлами * .tfrecords, но столкнулся с проблемой, когда я запустил процесс обучения, я получил следующее:

 ValueError: Tried to convert 'input' to a tensor and failed. Error: Shapes must be equal rank, but are 4 and 3
    From merging shape 0 with other shapes. for '{{node discriminator_1/512x512/FromRGB/conv/Conv2D/packed}} = Pack[N=2, T=DT_FLOAT, axis=0](generator/StatefulPartitionedCall, generator/StatefulPartitionedCall:1)' with input shapes: [4,3,512,512], [4,16,512].

что я понимаю заключается в том, что процесс обучения ожидает un NCH или NCW (размер пакета, каналы, высота ИЛИ ширина, поскольку изображения квадратные, одного измерения достаточно), и я предоставляю набор данных NCHW как с высотой, так и шириной. Но, во-первых, на самом деле я не уверен, что это не наоборот, так как я не совсем понимаю, кто в форме [4,3,512,512], а кто [4,16,512], и не нашел способа проверить форма моих файлов tfrecords? есть ли способ сделать это?

и я бы добавил, есть ли способ изменить форму набора данных * .tfrecords?

...