Нерегулярные / отсутствующие данные при кластеризации временных рядов - PullRequest
2 голосов
/ 21 февраля 2020

Будь то динамическая c временная деформация или какая-то евклидова кластеризация k-средних по временному ряду, (почти?) Всегда необходимо учитывать нерегулярный интервал данных, неравные длины данных и / или их отсутствие Необходимость данных.

Понимая, что у каждой из этих проблем есть свои соображения, существует ли общая причина, по которой предварительная обработка каждого временного ряда со сплайном позволяет интерполировать (или очень минимально экстраполировать) данные для улучшения этих вопросы не могут быть сделаны?

1 Ответ

1 голос
/ 22 февраля 2020

Не понимаю, почему нет. Я думаю, что главное, что нужно учитывать, это то, что вы делаете. Предположения, которые приходят на ум для такой процедуры, по крайней мере, мне:

  1. Сплайны могут адекватно описывать (сглаживать) каждый временной ряд, и различия захвата между ними.

  2. Входные данные в процедуре кластеризации описывают истинные различия между сплайнами и, следовательно, временными рядами.

Входные данные в Процедура кластеризации может быть оценочной функцией сплайна или коэффициентами сплайна. Конечно, расчетные коэффициенты было бы проще использовать, но вы бы хотели, чтобы различия между ними действительно представляли различия в функции сплайна. Это может сводиться к ортогональности базисной функции сплайнов, но я не уверен, существует ли теория, подтверждающая это или нет.

...