Пользовательская функция потерь с дополнительными входными данными - PullRequest
1 голос
/ 21 февраля 2020

Я пытаюсь построить пользовательскую функцию потерь для последовательной модели. В этой функции потерь y_true и y_pred используются для вычисления ошибки. Когда я пытаюсь заменить тензор y_true, чтобы все истинные значения из модели внешними истинными значениями, которые должны быть одинаковыми, я получаю разные результаты (около половины ожидаемых значений). Чтобы сделать это более понятным, вот часть моего кода, который работает:

import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
import tensorflow as tf
from tensorflow import keras

def custom_loss(y_true, y_pred):
    loss = tf.square(y_pred - y_true) + tf.square(y_pred - y_true)
return loss

model = Sequential()
model.add(Dense(5, input_dim=4, activation='tanh', use_bias=True)) # 1
model.add(Dense(5, activation='tanh')) # 2
model.add(Dense(5, activation='tanh')) # 3
model.add(Dense(5, activation='tanh')) # 4
model.add(Dense(5, activation='tanh')) # 5
model.add(Dense(1))
model.compile(loss=custom_loss, optimizer='adam', metrics=['accuracy'])

Когда я сейчас пытаюсь заменить одну из y_true внешней переменной, преобразованной в тензор, я не получаю те же результаты. input_scaled - это тот же массив numpy, который также используется в model.fit, поэтому я ожидаю, что эти две пользовательские функции потерь будут давать одинаковый вывод.

input_as_tensor = tf.convert_to_tensor(np.float32(input_scaled))

def custom_loss(y_true, y_pred):
    loss = tf.square(y_pred - y_true) + tf.square(y_pred - input_as_tensor)
return loss

# ...as above...
hist = model.fit(input_to_fit, input_scaled, epochs=300, callbacks=[tensorboard_callback], validation_split=0.2)

Я использую версию TensorFlow : 2.0.0. Любая идея дать объяснение разницы будет принята.

Редактировать: Я понял, что Keras обрабатывает мои входные данные со стандартным размером пакета 32, и поэтому существует несоответствие размеров между моим input_as_tensor и y_true, который имеет другой размер. Я должен выяснить, как вычесть правильные значения из моего input_as_tensor.

1 Ответ

0 голосов
/ 21 февраля 2020

Если вы не установите начальное значение для используемой модели, вы никогда не получите тот же результат, даже если вы используете тот же код и те же данные.

...