R - Как кластеризовать набор данных, который содержит последующие измерения? - PullRequest
0 голосов
/ 24 сентября 2019

У меня есть набор данных, содержащий три последовательных измерения (dput в конце), который содержит два типа наблюдений: одно, где значения увеличиваются со временем, и второе, где они уменьшаются.Я хотел бы кластеризовать этот набор данных таким образом, чтобы он учитывал характер данных (так называемые последующие измерения).Я попробовал kmeans (с 2 центрами) так же, как и PCA, но оба просто возвращают большой кусок с некоторыми выбросами.

Использую ли я неправильный подход?Я хотел бы сделать сюжет с двумя разными группами, он не должен сохранять больше сложности, чем эта.

Спасибо за ваше время.

structure(list(`Measurement 1` = c(14064, 3561, 13671, 2464, 
2323, 4783, 2432, 2039, 10337, 2145, 2423, 4612, 7322, 4084, 
2028, 9059, 7853, 6000, 3787, 1918, 3799, 3168, 2888, 3115, 3115, 
2628, 5080, 2721, 4963, 4564, 2681, 2015, 3825, 7110, 3450, 2673, 
2673, 5304, 2837, 9867, 2168, 5863, 5405, 4057, 4709, 4222, 2317, 
3327, 8721, 3530, 10761, 2524, 2775, 3045, 5539, 9823, 3386, 
4231, 8427, 2324, 7166, 42169, 9837, 6049, 37087, 2489, 8760, 
5409, 3595, 7259, 3970, 5050, 2528, 3534, 4820, 2541, 4313, 5951, 
2188, 2882, 24922, 6848, 20454, 3580, 1021, 4614, 14488, 3509, 
7929, 922, 5552, 5295, 5944, 1535, 25797, 4805, 3169, 1284, 1860, 
5660, 3038, 3192, 2711, 54234, 2133, 5907, 3146, 23530, 17529
), `Measurement 2` = c(6601, 934, 3954, 1800, 5048, 5640, 6171, 
2012, 2351, 2317, 6568, 1202, 8657, 8824, 2133, 5168, 3603, 5080, 
1933, 3146, 1969, 3625, 5221, 5882, 3277, 1267, 1702, 2860, 13561, 
1668, 3959, 1392, 10573, 7944, 6360, 3388, 3298, 13143, 6635, 
2296, 3079, 4702, 8935, 7219, 2899, 3254, 1822, 5869, 16290, 
2389, 2745, 2846, 2775, 2887, 4353, 4734, 8639, 8668, 5643, 2489, 
5965, 4848, 5952, 9772, 5847, 3324, 6000, 5409, 3210, 8490, 795, 
1976, 3790, 3663, 1649, 3349, 6894, 8955, 3671, 3836, 6993, 6524, 
32790, 3800, 1667, 7301, 8660, 5952, 5841, 1354, 3821, 4529, 
3735, 1497, 8427, 3870, 4573, 3526, 1557, 4789, 3509, 5190, 5777, 
39474, 4944, 10855, 2323, 3731, 3522), `Measurement 3` = c(6601, 
996, 3930, 3119, 15243, 10103, 16490, 3335, 1784, 3696, 6818, 
1046, 12320, 7676, 2894, 4062, 3479, 6048, 4146, 9048, 3267, 
6716, 4211, 9886, 6237, 1958, 1971, 6458, 6249, 2326, 6369, 1573, 
12975, 9927, 8719, 3724, 4785, 11031, 7350, 2420, 6316, 11882, 
9610, 9379, 5368, 5326, 3140, 9327, 7122, 5158, 2825, 1583, 3367, 
3223, 5964, 3449, 6668, 13376, 11031, 5085, 16883, 6553, 9943, 
25798, 4595, 5080, 4492, 13035, 11020, 7967, 955, 3728, 6380, 
6731, 7264, 8833, 6569, 14389, 7526, 6452, 6096, 11688, 14664, 
4162, 3323, 7447, 5785, 7669, 10576, 2446, 7808, 8279, 7895, 
1155, 5540, 4890, 2326, 6049, 4817, 9568, 7139, 10892, 11546, 
26112, 5237, 5433, 9209, 5209, 2666)), row.names = c("48", "51", 
"61", "86", "97", "119", "129", "169", "174", "196", "213", "222", 
"289", "292", "303", "309", "85", "82", "5", "32", "35", "45", 
"57", "59", "72", "74", "79", "87", "110", "117", "124", "128", 
"147", "149", "151", "160", "162", "175", "185", "187", "191", 
"200", "212", "218", "225", "226", "236", "240", "255", "256", 
"260", "261", "266", "269", "275", "277", "278", "287", "290", 
"298", "299", "304", "312", "330", "50", "67", "76", "133", "310", 
"293", "14", "20", "102", "104", "112", "122", "216", "224", 
"252", "327", "111", "206", "257", "81", "271", "308", "332", 
"10", "33", "94", "126", "145", "168", "241", "294", "302", "316", 
"331", "99", "105", "138", "150", "66", "223", "8", "29", "98", 
"253", "306"), class = c("tbl_df", "tbl", "data.frame"))
...