Много ко многим LSTM с вниманием на каждом временном шаге - PullRequest
0 голосов
/ 19 марта 2019

Я работаю над классификацией изображений временных рядов, где мне нужно выводить классификацию на каждом временном шаге (многие ко многим).

Мой график Tensorflow принимает [Размер партии, Шаг по времени, Изображение] и реализует глубокий CNN-LSTM, который в настоящее время переходит к плотному слою с распределением по времени перед классификацией.

В моей предыдущей работе я добился большого успеха, уделив внимание улучшению временных зависимостей модели путем взвешивания скрытых состояний временных шагов.Тем не менее, я не могу найти какие-либо реализации, которые пытаются использовать внимание в RNN многие-ко-многим.

Я пробовал использовать следующий код, который компилируется и работает, но работает хуже, чем модель без.Идея состоит в том, чтобы узнать вес внимания на каждом шаге, чтобы взвешивать каждый второй временной шаг на основе текущего временного шага.У меня есть 7,8 миллиона обучающих образцов, поэтому я не волнуюсь, что это переоснащение - фактически это увеличивает ошибку training по сравнению с моделью без!или указывает на документы!Я думал о том, чтобы попробовать модель внимания seq2seq, но это кажется немного натянутым.

1 Ответ

0 голосов
/ 26 марта 2019

Кажется, что этот код работал нормально. Ошибка была ниже по течению. Если кто-то использует этот код для реализации внимания «многие ко многим», учтите, что обучение займет очень много времени, поскольку вы изучаете две дополнительные весовые матрицы для каждого временного шага.

...