Question

Я работаю над классификацией изображений временных рядов, где мне нужно выводить классификацию на каждом временном шаге (многие ко многим).

Мой график Tensorflow принимает [Размер партии, Шаг по времени, Изображение] и реализует глубокий CNN-LSTM, который в настоящее время переходит к плотному слою с распределением по времени перед классификацией.

В моей предыдущей работе я добился большого успеха, уделив внимание улучшению временных зависимостей модели путем взвешивания скрытых состояний временных шагов.Тем не менее, я не могу найти какие-либо реализации, которые пытаются использовать внимание в RNN многие-ко-многим.

Я пробовал использовать следующий код, который компилируется и работает, но работает хуже, чем модель без.Идея состоит в том, чтобы узнать вес внимания на каждом шаге, чтобы взвешивать каждый второй временной шаг на основе текущего временного шага.У меня есть 7,8 миллиона обучающих образцов, поэтому я не волнуюсь, что это переоснащение - фактически это увеличивает ошибку training по сравнению с моделью без!или указывает на документы!Я думал о том, чтобы попробовать модель внимания seq2seq, но это кажется немного натянутым.

John Brandt · Answer 1 · 26 марта 2019

Кажется, что этот код работал нормально. Ошибка была ниже по течению. Если кто-то использует этот код для реализации внимания «многие ко многим», учтите, что обучение займет очень много времени, поскольку вы изучаете две дополнительные весовые матрицы для каждого временного шага.

Много ко многим LSTM с вниманием на каждом временном шаге

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Много ко многим LSTM с вниманием на каждом временном шаге

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы