создать матрицу расстояний из строкового столбца в кадре данных - PullRequest
0 голосов
/ 02 мая 2019

Я пытаюсь использовать этот код безуспешно:

library(fuzzywuzzyR)
library(proxy)

set.seed(42)
rm(list = ls())
options(scipen = 999)

init = FuzzMatcher$new()

data <- data.frame(string = c("aaaaa baaaaa", "baaaaa xxxhhx ", "caaaaa hhhr ejhhehe"))
data$string <- as.character(data$string)

f <- function(string_1, string_2) {
    init$Token_set_ratio(string1 = string_1, string2 = string_2, force_ascii = TRUE, full_process = TRUE)
}

proxy::dist(data$string, method = f)

Целью является создание расстояний между каждой строкой с использованием пакетов proxy :: dist и fuzzywuzzyR.

Ошибка:

Ошибка: оба параметра 'string1' и 'string2' должны иметь тип символьная строка. Дополнительно: предупреждающее сообщение: In do.call (". External", c (list (CFUN, x, y, попарно, если (! Is.function (метод)) get (метод) else метод),: NA, введенные по принуждению

1 Ответ

0 голосов
/ 03 мая 2019

Я проверил это на своей машине и установил пакет fuzzywuzzyr ​​с помощью install.packages.Это прекрасно установило пакет, но когда я запускаю init$Token_set_ratio(string1 = s1, string2 = s2, force_ascii = TRUE, full_process = TRUE) , это дает мне ошибку attempt to apply non-function, которая, в свою очередь, возвращает NAs introduced by coercion при последующем вызове proxy::dist.Я считаю, что проблема может быть похожа на https://github.com/mlampros/fuzzywuzzyR/issues/4, и я даже не могу запустить основные примеры в виньетке.Я считаю, что пакет поврежден или не поддерживается, так как я не могу даже запустить раздел утилит в репозитории github, не получив ту же ошибку, не связанную с функциями.Извините, что это не может решить вашу проблему, но, возможно, это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...