Я реализую следующую архитектуру в Tensorflow 2.0 Двойной кодер LSTM
C и R - предложения, закодированные в фиксированное измерение двумя LSTM. Затем они передаются через сигмовидную функцию (CMR). Можно предположить, что R и C являются 256-мерными матрицами, а M - 256 * 256. Матрица М изучается во время обучения. Поскольку я хочу тренировать M, я объявил M = tf.Variable (shape, trainable = True). Но после подгонки модели значения М по-прежнему не меняются. Как сказать tenorflow автоматически вычислять градиенты для M? Ниже мой код. код