Как ограничить findAssocs () выбранными словами? - PullRequest
0 голосов
/ 19 января 2019

Я хочу найти связи только между несколькими словами и входными данными, например,

{
data("crude")
tdm <- TermDocumentMatrix(crude)
findAssocs(tdm, c("oil", "opec", "xyz"), 0.1)
 }

Здесь я хочу найти только корреляции между c("oil", "opec", "xyz") и soln = c("was","are","were","am","is","been","being","be"), а невесь TDM.

Как этого добиться?

Я могу извлечь эти результаты после вычислений, но мне бы хотелось, чтобы они были эффективными в вычислительном отношении и, таким образом, вычисляли ассоциации только для вектора soln, как показано выше,а не любые другие слова.

1 Ответ

0 голосов
/ 23 января 2019

Я решил эту проблему, углубившись в реализацию функции findAssocs ().Он использует cor для определения ассоциаций.Таким образом, решение вышеуказанной проблемы выглядит примерно так:

cd<- cor(termFreq1[j,], termFreq1[i,])
...