Я пытаюсь понять идею Иерархической сети внимания (HAN), большая часть кода, который я нахожу в сети, более или менее похожа на приведенную здесь: https://medium.com/jatana/report-on-text-classification-using-cnn-rnn-han-f0e887214d5f:
embedding_layer=Embedding(len(word_index)+1,EMBEDDING_DIM,weights=[embedding_matrix],
input_length=MAX_SENT_LENGTH,trainable=True)
sentence_input = Input(shape=(MAX_SENT_LENGTH,), dtype='int32', name='input1')
embedded_sequences = embedding_layer(sentence_input)
l_lstm = Bidirectional(LSTM(100))(embedded_sequences)
sentEncoder = Model(sentence_input, l_lstm)
review_input = Input(shape=(MAX_SENTS,MAX_SENT_LENGTH), dtype='int32', name='input2')
review_encoder = TimeDistributed(sentEncoder)(review_input)
l_lstm_sent = Bidirectional(LSTM(100))(review_encoder)
preds = Dense(len(macronum), activation='softmax')(l_lstm_sent)
model = Model(review_input, preds)
Мой вопрос: что представляют здесь входные слои? Я предполагаю, что input1 представляет предложения, обернутые слоем внедрения, но в таком случае что такое input2? Это вывод sendEncoder? В этом случае это должен быть float, или если это другой слой встроенных слов, то он должен быть также обернут слоем для встраивания.