анализ униграмм и биграмм дает мне одинаковый результат - PullRequest
0 голосов
/ 09 февраля 2020

bigram <- функция (x) NGramTokenizer (x, Weka_control (min = 2, max = 2)) </p>

bigram_matrix <- TermDocumentMatrix (my_corpus, control = list (tokenize = bigram)) </p>

bigram_corpus <- findFreqTerms (bigram_matrix, lowfreq = 80) </p>

bigram_corpus_num <- rowSums (as.matrix (bigram_matrix [bigram_corpus,])) </p>

bigram_corpra_me <- data <- data <- data <data = имена (bigram_corpus_num), частота = bigram_corpus_num) </p>

bigram_corpus_tab <- bigram_corpus_tab [порядок (-bigram_corpus_tab $ частота),] я получаю такой же вывод для биграма, как и для униграммы </p>

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...