tenortflow triplet_semihard_loss не меняется после нескольких эпох - PullRequest
1 голос
/ 10 октября 2019

Я пишу базовую версию обучения пользовательской системе повторной идентификации лиц (с использованием данных mnist в качестве строительных блоков и функции полутвердой потери триплетов, определенной тензорным потоком), но потеря / акк не показывает абсолютно никаких изменений после нескольких эпох. Код ниже


def kerasTriplet( label, pred ):
        print('-------------------------')
        print( label )
        print( pred )
        def lossFunc( y_true, y_pred ):
                return tf.contrib.losses.metric_learning.triplet_semihard_loss( label, pred, 0.6 )
                #return nonTFTripletLoss.batch_hard_triplet_loss( label, pred, 0.6 )

        return lossFunc

def gen( trg, tgt ):
        batch_sz = BATCH_SZ
        start = np.random.randint( 0, len( trg ) - BATCH_SZ )
        return trg[ start: start+batch_sz] , tgt[ start: start+batch_sz ]

(x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()
n_train, height, width = x_train.shape
x_train = x_train.reshape(n_train, height, width, 1).astype('float32')
x_train = x_train[ :(int(len(x_train)/BATCH_SZ))*BATCH_SZ ]
x_train /= 255
num_classes = 10
y_train_orig = y_train
y_train_orig = y_train_orig[ :(int(len(x_train)/BATCH_SZ))*BATCH_SZ ]
y_train = tf.keras.utils.to_categorical(y_train, num_classes)

input_shape = (28, 28, 1)

sequence_input = tf.keras.layers.Input(shape=input_shape , dtype='float32')
batch_inp, batch_tgt = gen( x_train, y_train_orig )


x = tf.keras.layers.Conv2D( 512, (3,3), activation='relu')( batch_inp )
x = tf.keras.layers.Conv2D( 256, (3,3), activation='relu')( x )
x = tf.keras.layers.Conv2D( 128, (3,3), activation='relu')( x )

x = tf.keras.layers.Flatten()(x)
img_embedding = tf.keras.layers.Dense( 128 )(x)

## since triplet loss requires embedding to be l2 normalized
l2_embed = tf.keras.backend.l2_normalize( img_embedding, -1 )

model = tf.keras.models.Model( sequence_input , l2_embed )

model.compile( loss=kerasTriplet( batch_tgt, img_embedding ) , optimizer='adam', metrics=['acc'] )

model.fit(x_train, y_train_orig, batch_size=BATCH_SZ,  epochs=10 , verbose=1)



Я бы ожидал, что потери и акк будут двигаться, даже если и не очень (так как у меня всего 10 эпох), но это абсолютно одинаково. Я уверен, что это как-то связано с моим кодом. Просто не могу к нему приставить

1 Ответ

0 голосов
/ 16 октября 2019

Вы неправильно рассчитываете l2_embedding. Попробуйте это

l2_embed = tf.keras.backend.l2_normalize (img_embedding, axis = 1)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...