Я пытаюсь понять, как обучить LM, используя bi-LSTM в случае со «стеком bi LSTM».
В случае прямого LSTM нам просто нужно добавить классификационный слой поверх последних скрытых векторов.
Если мой пример: «Это яблоко очень вкусное, мне нравится», если мы используем, например, окна 5, x будет «это яблоко очень», а y будет «вкусно».
Но я не понимаю, как сделать то же самое с би LSTM. Я предполагаю, что есть своего рода маскирующий вектор, но я совсем не уверен.