Как преобразовать матрицу из 2 столбцов в таблицу данных - PullRequest
0 голосов
/ 30 ноября 2018

Я хочу создать словарь биграмм в R с пакетом тау.

Я получил биграммы в списке в виде чисел.поэтому я преобразовал его в матрицу, но без имени столбца.Я хочу, чтобы он был в таблице данных, чтобы я мог создать биграмму WordCloud с ним.

Пожалуйста, найдите мой код ниже и предложите выход.

library(tau)
speech1 = Corpus(VectorSource(speech))
myDTM = TermDocumentMatrix(speech1, control = list(minWordLength = 1))
bigrams = textcnt(speech1, n = 2, method = "string")
bigrams = bigrams[order(bigrams, decreasing = TRUE)
n = as.matrix(bigrams) 

Пожалуйста, предложите способ, какМогу ли я создать облако слов на биграмме.невозможно сделать с пакетом weka

1 Ответ

0 голосов
/ 30 ноября 2018

Если целью является облако слов, то проверьте эту страницу: http://www.rpubs.com/rgcmme/PLN-09, и вот небольшой адаптированный пример из него:

library(tm)
library(wordcloud)
# sample data
filePath <- "http://www.sthda.com/sthda/RDoc/example-files/martin-luther-king-i-have-a-dream-speech.txt"
speech <- readLines(filePath)

speech1 = Corpus(VectorSource(speech))
myDTM = TermDocumentMatrix(speech1, control = list(minWordLength = 1))
myDTM_mat <- as.matrix(myDTM)
myDTM_mat_sorted <- sort(rowSums(myDTM_mat),decreasing = TRUE)
myDTM_df <- data.frame(word = names(myDTM_mat_sorted), freq = myDTM_mat_sorted)
wordcloud(myDTM_df$word,
          myDTM_df$freq,
          max.words=100,
          random.order = F)

enter image description here

...