Как я могу сделать определение (получение корня слова) в арабском тексте, который состоит из 10000 предложений с использованием R?например, слово «اعلاميون» дает «علم», а «حركات» - «حرك»
arabic <- c("اعلاميون") arabic_document <- VCorpus(VectorSource(arabic)) arabic_stem <- tm_map(arabic_document, stemDocument, language = 'arabic')
Обычно работает, однако пакет tm не поддерживает арабский, насколько я могу судить.
tm
Попробуйте несколько вариантов;
library(arabicStemR) arabic <- tm_map(arabic_document, content_transformer(stem))
https://cran.r -project.org / веб / пакеты / arabicStemR / arabicStemR.pdf