Вы можете остановить слова с помощью stemDocument.Тогда вам нужно искать только выжившего и выжившего, так как это слова, которые вы ищете.Использование и расширение списка слов из @ AshOfFire
my_corpus <- VCorpus(VectorSource(c("survival", "survivance", "survival",
"random", "yes", "survive", "survivors", "surviving")))
my_corpus <- tm_map(my_corpus, stemDocument)
my_dtm <- DocumentTermMatrix(my_corpus, control = list(dictionary = c("surviv", "survivor")))
inspect(my_dtm)
<<DocumentTermMatrix (documents: 8, terms: 2)>>
Non-/sparse entries: 6/10
Sparsity : 62%
Maximal term length: 8
Weighting : term frequency (tf)
Sample :
Terms
Docs surviv survivor
1 1 0
2 1 0
3 1 0
4 0 0
5 0 0
6 1 0
7 0 1
8 1 0
ps делает x <- inspect(DocumentTermMatrix(docs, .....)
только если вы хотите получить первые 10 строк и 10 столбцов в вашей переменной x.