Я пытаюсь найти пределы в анализе временных рядов.
Например:
Здесь у нас есть три (плоских) пика, и границы четко определены
| aaaaaaaaaaaaaaaa
| aaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaa
| aaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaaaaaaaa
| aaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaaaaaaaa
|aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
|---------------------------------------------------------------------------------
| + | + | + | + | + | + | + | + |
1 10 20 30 40 50 60 70 80
Где пределы:
1-) от 5 до 20
2-) от 26 до 42
3-) от 54 до 75
Но иногда есть шум, как в следующем примере:
| aa aa a aa
| aaa aaaaa aaa a a a aa aa a a a aaaa aa a a
| aaaa aaaaaaaaaaa aaaa aaaaaaaaa a aaaaaaaaa aaaaaaaaa aa
| aaaaaaaaaaaaaaaa a aaaaaaaaaaaaaaaa aa a a aaaaaaaaaaaaaaaaaaaaaa
|aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
|---------------------------------------------------------------------------------
| + | + | + | + | + | + | + | + |
1 10 20 30 40 50 60 70 80
Здесь пределы не определены четко, но могут иметь три или 4 пика и связанные области.
Чтобы решить эту проблему, я попытался использовать сглаженный z-показатель (чтобы найти пики) и попытался найти самую длинную область выше порога.
Несмотря на то, что мне удалось найти инверсию (пики) в определенной фазе задержки (скользящее окно), я не смог определить области интереса.
Мне интересно, достаточно ли хороши модели гауссовых смесей (GMM) или пороговое значение отсу для такого рода данных.
Также, как я могу определить количество регионов, если они неизвестны (я не знаю количество компонентов).
Есть ли другой хороший алгоритм для разделения мультимодальных дистрибутивов?