Боюсь, у вас проблема с данными.
Вы не можете извлечь записку из этого студента, потому что у вас ее нет. Единственное, что приходит мне в голову, это то, что вы можете переориентировать свою проблему и сделать следующее:
Создайте LSTM для оценки предметов учащегося.
Создайте сеть, которая сравнивает вас с другим учеником и сообщает
Вы, если это лучше или хуже (через шаг 1). Это известно как
Сиамская сеть.
У вас есть то, что сказано LSTM сиамский.
Что вы могли бы сделать в прогнозировании, так это узнать, имеет ли студент, основанный на оценках по своим предметам, лучше или хуже, чем другой студент.
EDIT
Может быть полезна одна архитектура, похожая на эту.
![enter image description here](https://i.stack.imgur.com/AN78J.jpg)
Используйте LSTM для получения информации о любом предмете и соответствующей отметке.
Когда информация сгущена, я объединяю эту информацию со студентом в горячем виде.
Мы используем Dense или множественную плотность для получения отметки при активации сигмоида в последнем слое.
Мы используем функцию потерь, чтобы максимизировать ноту a относительно b, когда a лучше, чем b. И иначе.
y_i - ваша цель в 1 o -1. 1, если ученик а лучше ученика b, и -1, если ученик а хуже ученика b.
Я никогда не пробовал этот тип функции потери, поэтому я не могу сказать вам, работает она или нет. Он основан на потере, которую использует SVM: https://en.wikipedia.org/wiki/Support-vector_machine
Может быть, другой пользователь поможет вам лучше.