Как работает один кластер дней для нескольких временных рядов? - PullRequest
0 голосов
/ 19 сентября 2019

Вот мой маленький выдуманный пример и моя процедура на данный момент:

Сцена

Рабочие свойства / условия машины записываются ежедневно.Условия меняются с разной скоростью и объемами.

Это изображение является выдержкой (со дня 232-416) для рабочих условий (стандартизировано, с тепловой картой):

HeatMap

Оси:

  • строки: столбцы день выполнения
  • столбцы: Условия эксплуатации

Машина выполняет различные задачии работает в разных режимах.Мы хотим кластеризовать периодов времени, в течение которых машина находится в разных режимах работы.Предположим, что мы не знаем или не понимаем измеренные переменные или режимы работы интуитивно.Поэтому мы пытаемся сгруппировать данные и получить следующий график:

Примечание: используется спектральная кластеризация enter image description here

Предложенияо том, как лучше визуализировать эти данные, приветствуются Примечание: используется спектральная кластеризация (не агломерационная)

Мотивация - Уровень шума

Теперь давайте предположим, что нас интересует одна из этих переменных - noise .За годы работы машина изнашивается, становится очень шумной, а когда порог шума становится слишком высоким, машина отправляется на техническое обслуживание.

Однако уровень шума нестабилен и зависит в первую очередь от выполняемой задачи, а не от того, как долго она работает.

Наша цель - найти скорость, с которой шум увеличивается.Мы делаем это путем

  • кластеризации дней работы по различным видам работы
  • группированием интервалов времени, в основном принадлежащих одному кластеру
  • измерением изменения шума за эти интервалы времени
  • средневзвешенное значение по изменению шума (с более новыми кластерами, весящими больше)

enter image description here

Проблема что результирующая таблица кластеров в день является достаточно изменчивой (как вы можете видеть на втором рисунке).Мой список больше похож на array([3, 5, 6, 4, 3, 0, 6, 3, 3, 4, 3, 4, 2, 0, 6, 1, 3, 2, 2, ... 700 more values ...])

Как мне сгруппировать его так, чтобы он соответствовал кластеризации в верхней части графика на рисунке 3?

Также , можно ли ...

  • кластеризовать временные индексы из необработанных данных нескольких временных рядов?
  • использовать спектральную кластеризацию для кластеризации временных рядов?

PS Я пишу на Python - на случай, если кто-нибудь захочет порекомендовать библиотеки или пакеты

...