Я работаю над классификацией изображений временных рядов, где мне нужно выводить классификацию на каждом временном шаге (многие ко многим).
Мой график Tensorflow принимает [Размер партии, Шаг по времени, Изображение] и реализует глубокий CNN-LSTM, который в настоящее время переходит к плотному слою с распределением по времени перед классификацией.
В моей предыдущей работе я добился большого успеха, уделив внимание улучшению временных зависимостей модели путем взвешивания скрытых состояний временных шагов.Тем не менее, я не могу найти какие-либо реализации, которые пытаются использовать внимание в RNN многие-ко-многим.
Я пробовал использовать следующий код, который компилируется и работает, но работает хуже, чем модель без.Идея состоит в том, чтобы узнать вес внимания на каждом шаге, чтобы взвешивать каждый второй временной шаг на основе текущего временного шага.У меня есть 7,8 миллиона обучающих образцов, поэтому я не волнуюсь, что это переоснащение - фактически это увеличивает ошибку training по сравнению с моделью без!или указывает на документы!Я думал о том, чтобы попробовать модель внимания seq2seq, но это кажется немного натянутым.