PyTorch LSTM входное измерение - PullRequest
0 голосов
/ 08 июня 2019

Я пытаюсь обучить простую двухслойную нейронную сеть с помощью PyTorch LSTM, и у меня возникают проблемы с интерпретацией документации PyTorch.В частности, я не слишком уверен, как поступить с формой моих тренировочных данных.

То, что я хочу сделать, - это обучить мою сеть на очень большом наборе данных с помощью мини-пакетов, где каждая партия имеет длину 100 элементов.Каждый элемент данных будет иметь 5 функций.В документации говорится, что входные данные для слоя должны иметь форму (seq_len, batch_size, input_size).Как мне изменить форму ввода?

Я следил за этим постом: https://discuss.pytorch.org/t/understanding-lstm-input/31110/3 и, если я правильно интерпретирую это, каждая мини-партия должна иметь форму (100, 100, 5).Но в этом случае, в чем разница между seq_len и batch_size?Кроме того, будет ли это означать, что первый слой, который входной слой LSTM должен иметь 5 единиц?

Спасибо!

...