Модель хорошо работала до шага оптимизации.Однако, когда я хочу оптимизировать свою модель, появляется сообщение об ошибке:
Несовместимые формы между операционным вводом и вычисленным входным градиентом.Операция пересылки: softmax_cross_entropy_with_logits_sg_12.Индекс ввода: 0. Исходная форма ввода: (16, 1).Расчетная входная градиентная форма: (16, 16)
следующий мой код.
import tensorflow as tf;
batch_size = 16
size = 400
labels = tf.placeholder(tf.int32, batch_size)
doc_encode = tf.placeholder(tf.float32, [batch_size, size])
W1 = tf.Variable(np.random.rand(size, 100), dtype=tf.float32, name='W1')
b1 = tf.Variable(np.zeros((100)), dtype=tf.float32, name='b1')
W2 = tf.Variable(np.random.rand(100, 1),dtype=tf.float32, name='W2')
b2 = tf.Variable(np.zeros((1)), dtype=tf.float32, name='b2')
D1 = tf.nn.relu(tf.matmul(doc_encode, W1) + b1)
D2 = tf.nn.selu(tf.matmul(D1, W2) + b2)
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=labels, logits=D2))
optim = tf.train.GradientDescentOptimizer(0.01).minimize(cost, aggregation_method=tf.AggregationMethod.EXPERIMENTAL_TREE)
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
_cost, _optim = sess.run([cost, optim], {labels:np.array([1, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1]), doc_encode: np.random.rand(batch_size, size)})