Вот мой маленький выдуманный пример и моя процедура на данный момент:
Сцена
Рабочие свойства / условия машины записываются ежедневно.Условия меняются с разной скоростью и объемами.
Это изображение является выдержкой (со дня 232-416) для рабочих условий (стандартизировано, с тепловой картой):
Оси:
- строки: столбцы день выполнения
- столбцы: Условия эксплуатации
Машина выполняет различные задачии работает в разных режимах.Мы хотим кластеризовать периодов времени, в течение которых машина находится в разных режимах работы.Предположим, что мы не знаем или не понимаем измеренные переменные или режимы работы интуитивно.Поэтому мы пытаемся сгруппировать данные и получить следующий график:
Примечание: используется спектральная кластеризация
Предложенияо том, как лучше визуализировать эти данные, приветствуются Примечание: используется спектральная кластеризация (не агломерационная)
Мотивация - Уровень шума
Теперь давайте предположим, что нас интересует одна из этих переменных - noise .За годы работы машина изнашивается, становится очень шумной, а когда порог шума становится слишком высоким, машина отправляется на техническое обслуживание.
Однако уровень шума нестабилен и зависит в первую очередь от выполняемой задачи, а не от того, как долго она работает.
Наша цель - найти скорость, с которой шум увеличивается.Мы делаем это путем
- кластеризации дней работы по различным видам работы
- группированием интервалов времени, в основном принадлежащих одному кластеру
- измерением изменения шума за эти интервалы времени
- средневзвешенное значение по изменению шума (с более новыми кластерами, весящими больше)
Проблема что результирующая таблица кластеров в день является достаточно изменчивой (как вы можете видеть на втором рисунке).Мой список больше похож на array([3, 5, 6, 4, 3, 0, 6, 3, 3, 4, 3, 4, 2, 0, 6, 1, 3, 2, 2, ... 700 more values ...])
Как мне сгруппировать его так, чтобы он соответствовал кластеризации в верхней части графика на рисунке 3?
Также , можно ли ...
- кластеризовать временные индексы из необработанных данных нескольких временных рядов?
- использовать спектральную кластеризацию для кластеризации временных рядов?
PS Я пишу на Python - на случай, если кто-нибудь захочет порекомендовать библиотеки или пакеты