Ограничение, упомянутое в вопросе, имело место в контексте Keras.
Я читал многочисленные посты относительно как иметь последовательности переменной длины в пакетах (и я понимаю ответы на нихсообщений), однако единственный пост, который я нашел относительно , почему здесь здесь, на Data Science , с ответом "В пределах одного пакета, вы должны иметь такое же количество шагов сэто должен быть тензор (это, как правило, там, где вы видите 0-отступ). "
Однако это кажется ненужным ограничением (я не очень знаком с Keras / TensorFlow, поэтому мой вопрос с точки зренияне относится к какому-либо API).
В учебных пакетах почему записи данных (я привел пример предложений) не могут иметь переменную длину (в моем примере это было бы количество слов)? Поскольку последовательности переменной длины представляют собой применение RNN, этот вопрос сводится к Почему не может быть переменного количества временных шагов вRNN во время обучения, для какой партии?
Вот следующие причины, которые заставили меня усомниться в отсутствии последовательностей переменной длины в партиях:
1) ДанныеЗаписи, независимо от размера пакета, в который они входят, имеют градиенты параметров RNN, связанных с записями.Размер пакета только влияет на фактическое изменение параметров сети на основе указанных вычисленных градиентов (среднее значение берется, а затем применяется на основе других гиперпараметров).Последовательности с переменной длиной будут иметь переменное количество временных шагов, однако градиент, связанный с каждой записью, уже усредняет влияние параметра сети на каждый временной шаг (и среднее возможно при любом количестве временных шагов)следовательно, независимо от количества временных шагов, градиент может быть успешно рассчитан для каждой записи и, следовательно, для всей партии (с использованием среднего градиента для всех записей).
2) :Параллелизм умножения матриц все еще возможен, как обычно, для пакета с последовательностями переменной длины, потому что умножение матриц распараллеливается для каждой записи в пакете, которая будет одной последовательностью, следовательно, фиксированной длины.