В моем csv-документе есть только отзывы (только строки без столбцов). Я хочу посчитать частоту слов, например love, например, best из моего csv-файла. Я не хочу частоту каждого слова. Я только хочу, сколько раз эти три слова появляются в моем документе CSV.
Я пробовал этот код, но он дает мне частоту каждого слова, которое я не хочу.
Может кто-нибудь помочь мне, как посчитать частоту конкретных слов или список конкретных слов?
texts <- read.csv("./Data/fast food/Domino's/Domino's veg pizza.csv",stringsAsFactors = FALSE)
docs <- Corpus(VectorSource(texts))
toSpace <- content_transformer(function (x , pattern ) gsub(pattern, " ", x))
docs <- tm_map(docs, toSpace, "/")
docs <- tm_map(docs, toSpace, "@")
docs <- tm_map(docs, toSpace, "\\|")
docs <- tm_map(docs, content_transformer(tolower))
docs <- tm_map(docs, removeNumbers)
docs <- tm_map(docs, removeWords, stopwords("english"))
docs <- tm_map(docs, removeWords, c("blabla1", "blabla2"))
docs <- tm_map(docs, removePunctuation)
docs <- tm_map(docs, stripWhitespace)
cor<-Corpus(VectorSource(texts$Reviews))
dtm <- TermDocumentMatrix(docs)
m <- as.matrix(dtm)
v <- sort(rowSums(m),decreasing=TRUE)
d <- data.frame(word = names(v),freq=v)
head(d, 20)
findFreqTerms(dtm, 10)