Заранее спасибо за помощь.У меня есть файл CSV, в котором каждая строка является респондентом (n = 612), и я хотел бы сравнить текст, который состоит из ответов в предложениях между двумя столбцами, один из которых описывает хороший опыт против плохого опыта, используя облако слов сравнения,
##First I merged my response columns
mydata2= mydata%>%
gather(response, text, Good, Bad)
mydata2$text <- sapply(mydata2$text,function(row) iconv(row, "latin1","ASCII", sub=""))
mydata2<-data.frame(mydata2)
## Calculate Corpus
docs<-Corpus(VectorSource(mydata2$text)) %>%
tm_map(removePunctuation) %>%
tm_map(removeNumbers) %>%
tm_map(tolower) %>%
tm_map(removeWords, stopwords("english")) %>%
tm_map(stripWhitespace) %>%
tm_map(PlainTextDocument)
inspect(docs)
tdm <- TermDocumentMatrix(docs)
Однако это не позволило бы мне сгенерировать tdm.Это лучший способ сравнения текстовых переменных в столбцах или мне следует создать два разных корпуса (один для хорошего и один для плохого) и сравнить их таким образом?
Спасибо