Question

У меня есть две модели, которые очень похожи во всех смыслах и целях - одна вещь оставляет меня в замешательстве, и я действительно не знаю, как решить проблему.

Первый имеет слой для встраивания с 250 измерениями, максимальная длина которого составляет 700, а число создаваемых им параметров составляет 20 000 000:

Layer (type)                    Output Shape         Param #     Connected to                     
==================================================================================================
input1 (InputLayer)             (None, 700)          0                                            
__________________________________________________________________________________________________
embedding_1 (Embedding)         (None, 700, 250)     20000000    input1[0][0]                     
__________________________________________________________________________________________________

Второй имеет в 5 раз меньше размеров и в 7 раз меньше максимальной длины и имеет почти в два раза больше параметров, чем первый.

Layer (type)                 Output Shape              Param #   
=================================================================
input (InputLayer)           (None, 100)               0         
_________________________________________________________________
embedding_1 (Embedding)      (None, 100, 50)           42511550  
_________________________________________________________________

Первый - это объединение двух различных вложений GloVe (200 + 50), а второй - 50-мерное вложение Word2Vec, которое я обучал сам.

Дайте мне знать, если я смогу предоставить какие-либо дополнительные подробности, я уверен, что здесь что-то упущено. Спасибо за любую помощь!

Может ли кто-нибудь помочь мне понять, почему встраиваемый слой с формой (700, 250) имеет почти на 20 миллионов больше параметров, чем аналогичный слой с формой (100, 50)?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Может ли кто-нибудь помочь мне понять, почему встраиваемый слой с формой (700, 250) имеет почти на 20 миллионов больше параметров, чем аналогичный слой с формой (100, 50)?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы