R: попарно евклидово расстояние между столбцами двух матриц - PullRequest
1 голос
/ 31 мая 2011

Следующий цикл занимает слишком много времени для запуска (2 минуты / итерация) Опухоль_сигнала размером 950000х422 Normal_signals имеет размер 950000x772 Есть идеи, как это ускорить?

for(i in 1:ncol(tumor_signals)){
x <- as.vector(tumor_signals[,i])
print("Assigned x")
y <- t((t(normal_signals) - x)^2)
print("assigned y")
y <- t(sqrt(colSums(y)))
print("done")
#all_distance <- cbind(all_distance,matrix(distance))
print(i)
}

1 Ответ

7 голосов
/ 31 мая 2011

В вашем коде есть ошибка - вам не нужно использовать транспонирование normal_signals. Насколько я понимаю, вы пытаетесь вычислить для всех i = 1,2,...422 и j=1,2,...,772 евклидово расстояние между tumor_signals[,i] и normal_signals[,j]. Вы, вероятно, хотели бы получить результаты в матрице 422 х 772. В пакете fields есть функция rdist(), которая сделает это за вас:

require(fields)
result <- rdist(t(tumor_signals), t(normal_signals))

Кстати, поиск Google для [R Euclidean distance] легко нашел бы этот пакет.

...