У меня проблемы с извлечением наилучшего совпадения из матрицы строкового расстояния.
Я использую пакет stringdist для вычисления матрицы строкового расстояния.
Например, я генерирую свою матрицу, используяэти строки кода.
library(stringdist)
lookup <- c('Dog', 'Cat', 'Bear')
data <- c('Do g', 'Do gg', 'Caat')
d.matrix <- stringdistmatrix(a = lookup, b = data, useNames="strings",method="cosine")
Матрица выглядит примерно так
Мой подход заключается в извлечении косинусного сходства снаименьшее число является лучшим соответствием.
Например, «Do g» будет совпадать с «Dog»
То, что я хочу сгенерировать, - это совпадающий фрейм данных пары со значением подобия consine
data | matchwith | cosine.s
Do g Dog 0.1338746
Do gg Dog 0.1271284
Caat Cat 0.05719096
Понятия не имею, как получить данные в нужном мне формате таблицы (см. Выше).
Любая помощь будет принята с благодарностью.