Как использовать R для вычисления показателя Танимото / Жаккарда в качестве матрицы расстояний - PullRequest
4 голосов
/ 08 апреля 2011

Я хотел бы рассчитать матрицу расстояний строк в массиве в R, используя показатель Танимото / Жаккарда в качестве матрицы расстояний.

Возможно ли это сделать? Если да, не могли бы вы научить меня, как это сделать?

Ответы [ 2 ]

10 голосов
/ 08 апреля 2011
Пакет

vegan имеет функцию vegdist, которая может вычислять, помимо прочего, индекс Жакара.Предполагая, что это то, что вы после.Его использование довольно просто.

library(vegan)
data(varespec)
vare.dist <- vegdist(varespec, method = "jaccard")

Другие доступные методы:

method   Dissimilarity index, partial match to "manhattan", "euclidean",
 "canberra", "bray", "kulczynski", "jaccard", "gower", "altGower", "morisita",
 "horn", "mountford", "raup" , "binomial" or "chao"
7 голосов
/ 08 апреля 2011

Я думаю, вам больше повезет в поиске "Jaccard", а не "Jacquard".

  • Установите пакет 'sos' (install.packages("sos"))
  • Поиск функций с помощью этих строк (library(sos); findFn("tanimoto jaccard")).
  • Просмотрите результаты для чего-то подходящего (мне кажется, этот , вероятно, ваш лучший вариант; install.packages("ade4"); library("ade4"); ?dist.binary)
  • Если вы не можете понять, как его использовать, отредактируйте свой вопрос, приведя небольшой воспроизводимый пример того, что вы хотите сделать.
...