Почему моя модель всегда возвращает нулевые потери в Keras Tensorflow при обучении в Google Colab? - PullRequest
0 голосов
/ 17 июня 2020

Я пытаюсь обучить простую модель на Colab, но она всегда возвращает 0 потерь проверки при использовании моего собственного кода !python train.py. Однако этот код отлично работает на моем компьютере. Кто-нибудь знает причину?

Epoch 1/500
2020-06-17 19:53:31.689547: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcublas.so.10
2020-06-17 19:53:31.889892: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcudnn.so.7
47/47 - 7s - loss: 52.6930 - mse: 2876.5457 - mae: 52.5915 - val_loss: 0.1029 - val_mse: 0.0000e+00 - val_mae: 0.0000e+00

Код для обучения:

    def build_model(self):
        new_model = self.base_model

        opt = Adam(lr=self.lr)
        new_model.compile(loss='mae',
                          optimizer=opt,
                          metrics=['mse', 'mae'])

        return new_model

    def train(self, base_epochs=500,
              save_model=False, save_path=None, cal_time=True):
        model = self.build_model()

        early_stopping = EarlyStopping(monitor='val_loss',
                                       patience=50,
                                       mode='min')
        save_best = ModelCheckpoint(filepath=save_file,
                                    monitor='val_loss',
                                    save_best_only=True,
                                    mode='min')
        cp_callback = [early_stopping, save_best]

        history = model.fit(
            x=self.standardize(self.train_data),
            y=self.train_labels,
            batch_size=self.batch_size,
            epochs=base_epochs,
            verbose=2,
            callbacks=cp_callback,
            validation_data=[self.standardize(self.val_data), self.val_labels],
        )
        return history

Еще написал код для проверки данных изображения.

    def check_data(self):
        data_name = ['Train Data', 'Train Labels', 'Validation Data', 'Validation Labels']
        for i, data in enumerate([self.train_data, self.train_labels, self.val_data, self.val_labels]):
            print('{0:<20}:  shape-{1:<20} type--{2}' \
                  .format(data_name[i], str(data.shape), data.dtype))

А вот информация о данных, это все numpy массивы:

Train Data          :  shape-(3000, 224, 224, 1)  type--float32
Train Labels        :  shape-(3000, 2)            type--float64
Validation Data     :  shape-(200, 224, 224, 1)   type--float32
Validation Labels   :  shape-(200, 2)             type--float64

1 Ответ

0 голосов
/ 25 июня 2020

Хорошо, я наконец нашел проблему:

Я передаю список validation_data=, который должен быть кортежем согласно официальному сайту.

Это должно быть:

history = model.fit(
    x=self.standardize(self.train_data),
    y=self.train_labels,
    batch_size=self.batch_size,
    epochs=base_epochs,
    verbose=2,
    callbacks=cp_callback,
    validation_data=(self.standardize(self.val_data), self.val_labels),
)
...