Я знаю, что лучший способ узнать это - просто проверить это, но я пытаюсь получить интуицию:
Допустим, у нас есть 100 000 примеров очень короткой серии, скажем, 20, где есть несколькоособенности ввода на каждом временном шаге и один ожидаемый результат.
Может ли разумно работать в этой ситуации?Почему или почему нет?