Как реализовать потерю softmax с переменной длиной выбора - PullRequest
0 голосов
/ 16 мая 2018

Я пытаюсь реализовать модель drqa в тензорном потоке, где я собираюсь предсказать начальную и конечную позицию подстроки ответа.Таким образом, имеется [batch_size, max_time] выход вероятностей, соответствующих контекстных последовательностей.Теперь я хочу применить кросс-энтропийную потерю softmax, но последовательности дополняются нулями.Поэтому я не хочу, чтобы отступы учитывались в потерях.Есть ли совет, как это реализовать?Спасибо.

1 Ответ

0 голосов
/ 16 мая 2018

Используйте веса.

tf.losses.softmax_cross_entropy(
  labels,
  logits,
  weights=[1.]* actual_length + [0.]* (max_length - actual_length)
)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...