У меня есть две модели, которые очень похожи во всех смыслах и целях - одна вещь оставляет меня в замешательстве, и я действительно не знаю, как решить проблему.
Первый имеет слой для встраивания с 250 измерениями, максимальная длина которого составляет 700, а число создаваемых им параметров составляет 20 000 000:
Layer (type) Output Shape Param # Connected to
==================================================================================================
input1 (InputLayer) (None, 700) 0
__________________________________________________________________________________________________
embedding_1 (Embedding) (None, 700, 250) 20000000 input1[0][0]
__________________________________________________________________________________________________
Второй имеет в 5 раз меньше размеров и в 7 раз меньше максимальной длины и имеет почти в два раза больше параметров, чем первый.
Layer (type) Output Shape Param #
=================================================================
input (InputLayer) (None, 100) 0
_________________________________________________________________
embedding_1 (Embedding) (None, 100, 50) 42511550
_________________________________________________________________
Первый - это объединение двух различных вложений GloVe (200 + 50), а второй - 50-мерное вложение Word2Vec, которое я обучал сам.
Дайте мне знать, если я смогу предоставить какие-либо дополнительные подробности, я уверен, что здесь что-то упущено. Спасибо за любую помощь!