Я думал об этом же вопросе некоторое время назад. Как указано в laydog, в документации написано
batch_first - если True, то тензоры ввода и вывода предоставляются
as (партия, последовательность, функция)
Насколько я понимаю, речь идет о кортеже скрытого состояния / ячейки, а не о фактических входах и выходах.
Мне кажется довольно очевидным, что это не влияет на скрытое состояние, как они упоминают:
(партия, последовательность, функция)
Это явно относится к входам и выходам, а не к кортежу состояний, который состоит из двух кортежей с формой:
(num_layers * num_directions, пакет, скрытый_размер)
Так что я почти уверен, что это не влияет на скрытое состояние и состояние ячейки, для меня также не имеет смысла изменять порядок кортежей скрытого состояния.
Надеюсь, это поможет.