Рассмотрим рекуррентный нейрон net, который имеет доступ к двум входным последовательностям
x1, x2, x3, x4 ....
и
s1, s2, s3, s4 ...
Выдает предсказания
p1, p2, p3, p4 ....
где
pi = RNN(si,xi,hi)
где hi - скрытое состояние, сформированное после просмотра s, x из t = 0 .... i-1
Я интересно понять, сколько из последовательности s и последовательности x из t = 0..i повлияло на прогноз p при t = i.
Я хочу два скаляра между [0,1], которые в сумме равны 1 представлять эффект обеих последовательностей. Скажем, скаляры равны 0,01 и 0,99, что означает, что последовательность s в основном игнорировалась.
Спасибо!