Что означает скрытый_дим и embed_size в LSTM? - PullRequest
0 голосов
/ 23 сентября 2019

Я пытаюсь выучить RNN и LSTM.Я пробираюсь через учебник для анализа настроений.Ниже приведен код I в руководстве, где word2idx - это словарь с отображением слова в индекс

    class SentimentNet(nn.Module):
        def __init__(self, vocab_size, output_size, embedding_dim, hidden_dim, n_layers, drop_prob=0.5):
        super(SentimentNet, self).__init__()
        self.output_size = output_size
        self.n_layers = n_layers
        self.hidden_dim = hidden_dim

        self.embedding = nn.Embedding(vocab_size, embedding_dim)
        self.lstm = nn.LSTM(embedding_dim, hidden_dim, n_layers, dropout=drop_prob, batch_first=True)
        self.dropout = nn.Dropout(drop_prob)
        self.fc = nn.Linear(hidden_dim, output_size)
        self.sigmoid = nn.Sigmoid()

     vocab_size = len(word2idx) + 1
     output_size = 1
     embedding_dim = 400
     hidden_dim = 512
     n_layers = 2

Может кто-нибудь сказать, пожалуйста, что означает vocal_size, embedding_dim, hidden_dim?

1 Ответ

0 голосов
/ 23 сентября 2019

Рекуррентная нейронная сеть (LSTM) на самом фундаментальном уровне - это просто тип плотно связанной нейронной сети.

Скрытое измерение - это, в основном, количество узлов в каждом слое (как в многослойном режиме).Персептрон, например)

Размер врезки сообщает вам размер вашего векторного элемента (модель использует встроенные слова в качестве входных данных)

здесь некоторые детали

...