Я пытаюсь воспроизвести это в Керасе:
LRCN обучен прогнозировать класс активности видео на каждом временном шаге.Чтобы получить прогнозирование по одной метке для всего видеоклипа, мы усредняем вероятности меток - выходы уровня softmax сети - по всем кадрам и выбираем наиболее вероятную метку.
Но я новичокв LSTM, и я не уверен, какие метрики и функцию потерь использовать для воспроизведения метода, примененного в тексте выше.До сих пор у меня есть LSTM RNN, который возвращает последовательности и их выходные данные, которые я передаю в плотно распределенный по времени слой из 3 классов.
«Кадр» соответствует временному шагу RNN, и return_sequences=True
включитмне вернуть прогноз на кадр.
Не могли бы вы сказать мне, какие метрики и потери мне нужны, и если мне нужны также пользовательские?