У меня есть вопрос о применении методов кластеризации, более конкретно, K-средних.
У меня есть фрейм данных с 3 датчиками (A, B, C):
time A | B | C |
8:00:00 6 10 11
8:30:00 11 17 20
9:00:00 22 22 15
9:30:00 20 22 21
10:00:00 17 26 26
10:30:00 16 45 29
11:00:00 19 43 22
11:30:00 20 32 22
... ... ... ...
И я хочу сгруппировать датчики с таким же поведением.
Мой вопрос: глядя на вышеупомянутый кадр данных, я должен вычислить корреляцию каждого объекта кадра данных, а затем применить евклидово расстояние к этой матрице корреляции, получив таким образом матрицу 3 * 3 со значением расстояний?
Или я транспонирую свой фрейм данных, а затем вычисляю матрицу dist () только с евклидовой метрикой, и тогда у меня будет матрица 3 * 3 со значением расстояний.