Используйте следующие данные игрушки для проверки результата.
set.seed(0)
city <- data.frame(pop = runif(101), pct.not.white = runif(101))
Наиболее очевидная «векторизация»:
# n <- nrow(city)
titj <- tcrossprod(city$pop)
pipj <- outer(city$pct.not.white, city$pct.not.white, "-")
numerator <- sum(titj * abs(pipj))
Возможно, проблема с памятью, если n > 5000
.
Умный обходной путь (использование симметрии; более эффективная память "векторизация"):
## see https://stackoverflow.com/a/52086291/4891738 for function: tri_ind
n <- nrow(city)
ij <- tri_ind(n, lower = TRUE, diag = FALSE)
titj <- city$pop[ij$i] * city$pop[ij$j]
pipj <- abs(city$pct.not.white[ij$i] - city$pct.not.white[ij$j])
numerator <- 2 * crossprod(titj, pipj)[1]
Окончательное решение - написать цикл C / C ++, который я не буду демонстрировать.