Я надеюсь, что кто-нибудь может мне помочь.Я только что установил пакет dtwclust
в R, чтобы использовать функцию tsclust
, поскольку я видел людей, успешно использующих его для кластеризации данных на этом форуме (под именем dtwclust
, поскольку функция была недавно обновлена)
Вот пример набора данных, с которым я работаю:
> print(trainset)
ACTIVITY_X ACTIVITY_Y ACTIVITY_Z Proportion
1: 19 21 28 1.0000000
2: 20 14 24 1.0000000
3: 34 35 49 1.0000000
4: 18 5 19 1.0000000
5: 23 27 35 1.0000000
---
399: 9 25 27 0.5250000
400: 0 0 0 1.0000000
401: 0 0 0 1.0000000
402: 3 3 4 0.7000000
403: 0 0 0 0.9090909
Теперь мне интересно, как мне следует реализовать функцию и, точнее, как отформатировать все аргументы.Я хотел бы использовать кластеризацию "нечеткого" типа, и мое желаемое количество кластеров k = 6:
> library(dtwclust)
> train = as.matrix(trainset, byrow = T, ncol=4)
> datacluster <- dtwclust(train, type = 'fuzzy', k=6L)
Когда дело доходит до остальных аргументов, доступных для функции, они установлены в "режим по умолчанию?Я запустил скрипт, как и выше, и получил разные цифры, используя:
plot(train_clust@cluster)
plot(train_clust)
Что я пытаюсь удивить, так это то, что вышеприведенный набор данных сгруппирован в k = 6.Если нет, я бы хотел поинтересоваться, как кластеризован мой набор данных, и раскрыть возможное значение k.
Мой вопрос: действительно ли остальная часть аргумента необходима для этого типа анализа?
В таком случае, может ли кто-нибудь поставить меня на правильный путь, какие из них наиболее актуальны?
Надеюсь, этот вопрос интересен большинству участников форума.Любой вклад приветствуется!