Это, вероятно, то, что вы ищете tf.math.reduce_max .
X_max = tf.reduce_max(X)
Возвращает одно максимальное значение из данного тензора X.
В контексте DQN при размере пакета 4 (4 строки) вы можете выбрать 4 максимальных значения Q, по одному для каждой строки.Вы можете сделать это следующим образом:
X_max = tf.reduce_max(X, axis=1)
Где X - ваша структура данных, содержащая значения Q с формой (4,10).Это возвращает 4 максимальных значения Q в одном тензоре X_max с выходной формой (4,1).