Быстрое расстояние Левенштейна в R? - PullRequest
25 голосов
/ 06 июля 2010

Существует ли пакет, содержащий функцию подсчета расстояний Левенштейна, которая реализована в виде кода на языке Си или Фортрана?У меня есть много строк для сравнения, и stringMatch из MiscPsycho слишком медленный для этого.

Ответы [ 3 ]

18 голосов
/ 06 июля 2010

levenshteinDist (из пакета RecordLinkage) вызывает скомпилированный C-код.Попробуйте.

14 голосов
/ 28 марта 2014

И stringdist в пакете stringdist делает это тоже, даже быстрее, чем levenshteinDist при определенных условиях ( 1 )

6 голосов
/ 06 июля 2010

Вы также можете попробовать stringDist из Biostrings

...