Я хочу применить косинусное сходство между двумя столбцами строк и получить их количество в R - PullRequest
0 голосов
/ 18 мая 2019

У меня есть два фрейма данных a (файл данных) и b (ссылка), из которых мне нужно сравнить столбец ответов, применить косинусное сходство, получить фрейм данных с наилучшими совпадающими значениями и их косинус. Позже мне нужно подсчитать каждый ответ b, присутствующий в a (на основе наилучших совпадающих значений, полученных после косинусного сходства).

 a <- data.frame(Answer = c("Hey <firstname>, here are some topics I have been helping folks", 
                            "here are some topics I have been helping folks, have a nice day,<
                            "hello there, here are some topics I have been helping folks",
                             "Your final job decisions post the cycle will be available on this site",
                            "Compensation details will be sent on mail. Final job decisions post the cycle will be available on this link, have a great day"))

 b <- data.frame(Answer = c("here are some topics I have been helping folks,"Final Rewards decisions post the cycle will be available here","reward decisions post the cycle will be available on this link, have a great day"))

Ожидаемый результат:

  Result = data.frame(Answer = c("here are some topics I have been helping folks,"Final Rewards decisions post the cycle will be available here"),count=c(3,2))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...