Вычисление сходства или расстояния между многими матрицами в R - PullRequest
0 голосов
/ 19 апреля 2020

Greenman снова наносит удар. Поэтому у меня есть огромный набор данных для различных видов лечения пациентов. Каждое лечение будет соответствовать матрице из 7 столбцов признаков и n рядов пациентов. У меня есть список этих матриц лечения, из которых я могу позвонить, и я могу сопоставить матрицы по идентификатору пациента, чтобы размеры соответствовали, однако они не были квадратными. Большинство из них - 49 х 7 матриц.

Теперь я хочу сравнить, насколько похожа каждая процедура. Первым делом, я думаю, можно попытаться вычислить евклидово расстояние между матрицами. Я видел этот пост Евклидово расстояние между двумя матрицами в R Это даст матрицу расстояний между двумя матрицами лечения.

Но тогда проблема в том, как бы я сравнил и визуализировал сходство между всеми интересующими видами лечения? Я могу сделать тепловую карту, я думаю, но для этого требуется, чтобы входная дис-матрица между любыми матрицами представляла собой «одно число», а не матрицу, вычисляемую как сообщение в ссылке, верно?

set.seed(123)
mat1 <- data.frame(x=sample(1:10000,3), 
                   y=sample(1:10000,3), 
                   z=sample(1:10000,3))
mat2 <- data.frame(x=sample(1:100,3), 
                   y=sample(1:100,3), 
                   z=sample(1:1000,3))
mat3 <- data.frame(x=sample(1:10000,3), 
                   y=sample(1:10000,3), 
                   z=sample(1:10000,3))
mat4 <- data.frame(x=sample(1:10000,3), 
                   y=sample(1:10000,3), 
                   z=sample(1:10000,3))

Так как же я могу сравнить расстояние между всеми четырьмя матрицами здесь и визуализировать их в тепловой карте? И как я должен оценить и проверить их от ближайшего к дальнейшему?

Спасибо

...