Я нашел большой успех, используя CNN для анализа данных акселерометра. Вот пример того, как CNN изучают наиболее важные особенности данных ускорения для пользователя, спускающегося вниз.
https://i.imgur.com/9sbwyeR.png
А вот картина моей общей настройки слоя (сверху вниз) о том, как я выполняю это (2 Conv1D, максимальное объединение, 2 Conv1D, среднее объединение)
https://i.imgur.com/0AlUMZV.png
У меня вопрос, когда я ставлю LSTMв конце этой архитектуры его средняя активация очень странная, и она выглядит примерно так:
Архитектура теперь (2 Conv1D, максимальное объединение, 2 Conv1D, 1 LSTM, среднее объединение), и это то, чтоокончательная подпись CNN выглядит, когда интерпретируется LSTM. Почему вывод LSTM не похож на исходную форму?
https://i.imgur.com/EPx1dlM.png
Я много читал о том, как работает LSTM, особенно здесь: https://towardsdatascience.com/illustrated-guide-to-lstms-and-gru-s-a-step-by-step-explanation-44e9eb85bf21. Но это не помогает мне концептуализировать LSTM до уровня, на которомЯ могу себе представить, как Conv1D удаляет шум из данных акселерометра для наиболее важных функций.