Размер мини-партии во время прогнозирования - PullRequest
0 голосов
/ 27 сентября 2018

Я использую модель lstm.Я понимаю, что означает размер мини-партии при обучении модели.В основном это связано с обновлением градиента в пакете, а не после каждого образца.Но что означает размер мини-партии на этапе прогнозирования.Я не могу понять роль размера партии на этапе прогнозирования.Может ли изменение повлиять на мои результаты?

Ответы [ 2 ]

0 голосов
/ 27 сентября 2018

Размер партии и т. Д. Относятся только к обучению. После того, как ваша модель узнала (обучена), она просто сохранит веса. Во время тестирования или прогнозирования она просто использует сохраненные веса, чтобы сделать прогноз.

Byпо умолчанию ванильный LSTM сбрасывает состояния ячеек после размера пакета, но вы можете изменить это. Вы можете сделать это, чтобы обновлять состояния после эпохи или даже поддерживать все состояния.

0 голосов
/ 27 сентября 2018

Концепция пакета является более общей, чем просто вычисление градиентов.Большинство инфраструктур нейронных сетей позволяют вам вводить пакет изображений в вашу сеть, и они делают это, потому что это более эффективно и легко распараллеливается на GPU.

Увеличение или уменьшение размера пакета для прогнозирования, как правило, влияет только на вычислительныеэффективность, а не результаты.Только в случае модели с состоянием, такой как LSTM с состояниями (не обычным LSTM), вы получите результаты, которые меняются в зависимости от размера пакета.

...