Вы должны применять нормализацию к каждому кадру независимо, потому что в противном случае кадр, в котором ваша модель предсказывает огромное значение (потому что по какой-то причине это очень точно), может испортить весь прогноз (если вы не примените какой-то дополнительный механизм поверх этого, см. дополнительное примечание в конце). Что касается того, как это сделать, либо спрогнозируйте 1 значение и примените функцию, которая выводит значения от 0 до 1, например, сигмовидную функцию ( сигмовидная функция wiki ), или предскажите 2 значения (да или нет вероятностей), а затем примените softmax ( wiki функции Softmax ).
Итак, прямой ответ на ваш вопрос: примените сигмоид, и значение можно рассматривать как вероятность, потому что оно будет между 0 и 1.
Дополнительное примечание: вы также можете попытаться объединить результаты прогнозов с RNN или с каким-либо механизмом внимания