Технически, добавление тензора (m, 1) к тензору (1, P) дает тензор (m, P), передавая дважды (учитывая, что Y_hat для индексов (i, j) равно tf.matmul (X, w1) по индексу i плюс w0 по индексу j).Однако это не то, что должно происходить в сети прямой связи.
w1 действительно должен иметь форму (n, P), а затем смещение формируется правильно.tf.matmul (X, w1) имеет форму (m, P), а Y_hat имеет форму (m, P), используя ожидаемое вещание (поскольку он должен иметь ту же форму, что и Y).