Как я могу сделать на арабском тексте, используя R? - PullRequest
0 голосов
/ 03 мая 2019

Как я могу сделать определение (получение корня слова) в арабском тексте, который состоит из 10000 предложений с использованием R?например, слово «اعلاميون» дает «علم», а «حركات» - «حرك»

1 Ответ

0 голосов
/ 04 мая 2019
arabic <- c("اعلاميون")
arabic_document <- VCorpus(VectorSource(arabic))
arabic_stem <- tm_map(arabic_document, stemDocument, language = 'arabic')

Обычно работает, однако пакет tm не поддерживает арабский, насколько я могу судить.

Попробуйте несколько вариантов;

library(arabicStemR)

arabic <- tm_map(arabic_document, content_transformer(stem))

https://cran.r -project.org / веб / пакеты / arabicStemR / arabicStemR.pdf

...