Пакетное обучение в Keras LSTM - PullRequest
0 голосов
/ 19 апреля 2020

Если я использую batch_size из 32 в LSTM, сделанном с Keras, применяется ли функция потерь к каждой последовательности, а затем усредняется, или она применяется непосредственно ко всем последовательностям без учета каждой последовательности?

Заранее спасибо.

1 Ответ

1 голос
/ 19 апреля 2020

Поскольку единичный пакетный размер подразумевает обновление весов после последовательности, размер пакета 32 будет означать обновление весов после этих 32 последовательностей.

Таким образом, весы обновляются только после этого фрагмента из 32 последовательностей со средними потерями по всем этим, так как в противном случае, если потеря будет обновлена ​​для каждого из них сама по себе, она фактически представит обычный SGD с batch_size = 1.

...