У меня есть набор данных, содержащий три последовательных измерения (dput в конце), который содержит два типа наблюдений: одно, где значения увеличиваются со временем, и второе, где они уменьшаются.Я хотел бы кластеризовать этот набор данных таким образом, чтобы он учитывал характер данных (так называемые последующие измерения).Я попробовал kmeans (с 2 центрами) так же, как и PCA, но оба просто возвращают большой кусок с некоторыми выбросами.
Использую ли я неправильный подход?Я хотел бы сделать сюжет с двумя разными группами, он не должен сохранять больше сложности, чем эта.
Спасибо за ваше время.
structure(list(`Measurement 1` = c(14064, 3561, 13671, 2464,
2323, 4783, 2432, 2039, 10337, 2145, 2423, 4612, 7322, 4084,
2028, 9059, 7853, 6000, 3787, 1918, 3799, 3168, 2888, 3115, 3115,
2628, 5080, 2721, 4963, 4564, 2681, 2015, 3825, 7110, 3450, 2673,
2673, 5304, 2837, 9867, 2168, 5863, 5405, 4057, 4709, 4222, 2317,
3327, 8721, 3530, 10761, 2524, 2775, 3045, 5539, 9823, 3386,
4231, 8427, 2324, 7166, 42169, 9837, 6049, 37087, 2489, 8760,
5409, 3595, 7259, 3970, 5050, 2528, 3534, 4820, 2541, 4313, 5951,
2188, 2882, 24922, 6848, 20454, 3580, 1021, 4614, 14488, 3509,
7929, 922, 5552, 5295, 5944, 1535, 25797, 4805, 3169, 1284, 1860,
5660, 3038, 3192, 2711, 54234, 2133, 5907, 3146, 23530, 17529
), `Measurement 2` = c(6601, 934, 3954, 1800, 5048, 5640, 6171,
2012, 2351, 2317, 6568, 1202, 8657, 8824, 2133, 5168, 3603, 5080,
1933, 3146, 1969, 3625, 5221, 5882, 3277, 1267, 1702, 2860, 13561,
1668, 3959, 1392, 10573, 7944, 6360, 3388, 3298, 13143, 6635,
2296, 3079, 4702, 8935, 7219, 2899, 3254, 1822, 5869, 16290,
2389, 2745, 2846, 2775, 2887, 4353, 4734, 8639, 8668, 5643, 2489,
5965, 4848, 5952, 9772, 5847, 3324, 6000, 5409, 3210, 8490, 795,
1976, 3790, 3663, 1649, 3349, 6894, 8955, 3671, 3836, 6993, 6524,
32790, 3800, 1667, 7301, 8660, 5952, 5841, 1354, 3821, 4529,
3735, 1497, 8427, 3870, 4573, 3526, 1557, 4789, 3509, 5190, 5777,
39474, 4944, 10855, 2323, 3731, 3522), `Measurement 3` = c(6601,
996, 3930, 3119, 15243, 10103, 16490, 3335, 1784, 3696, 6818,
1046, 12320, 7676, 2894, 4062, 3479, 6048, 4146, 9048, 3267,
6716, 4211, 9886, 6237, 1958, 1971, 6458, 6249, 2326, 6369, 1573,
12975, 9927, 8719, 3724, 4785, 11031, 7350, 2420, 6316, 11882,
9610, 9379, 5368, 5326, 3140, 9327, 7122, 5158, 2825, 1583, 3367,
3223, 5964, 3449, 6668, 13376, 11031, 5085, 16883, 6553, 9943,
25798, 4595, 5080, 4492, 13035, 11020, 7967, 955, 3728, 6380,
6731, 7264, 8833, 6569, 14389, 7526, 6452, 6096, 11688, 14664,
4162, 3323, 7447, 5785, 7669, 10576, 2446, 7808, 8279, 7895,
1155, 5540, 4890, 2326, 6049, 4817, 9568, 7139, 10892, 11546,
26112, 5237, 5433, 9209, 5209, 2666)), row.names = c("48", "51",
"61", "86", "97", "119", "129", "169", "174", "196", "213", "222",
"289", "292", "303", "309", "85", "82", "5", "32", "35", "45",
"57", "59", "72", "74", "79", "87", "110", "117", "124", "128",
"147", "149", "151", "160", "162", "175", "185", "187", "191",
"200", "212", "218", "225", "226", "236", "240", "255", "256",
"260", "261", "266", "269", "275", "277", "278", "287", "290",
"298", "299", "304", "312", "330", "50", "67", "76", "133", "310",
"293", "14", "20", "102", "104", "112", "122", "216", "224",
"252", "327", "111", "206", "257", "81", "271", "308", "332",
"10", "33", "94", "126", "145", "168", "241", "294", "302", "316",
"331", "99", "105", "138", "150", "66", "223", "8", "29", "98",
"253", "306"), class = c("tbl_df", "tbl", "data.frame"))