Когда я преобразую в R
мой испанский текст в корпус, я могу применить stemDocument
в функции tm_map
, хотя он возвращает мне следующее предупреждение:
Warning message:
In tm_map.SimpleCorpus(col, stemDocument, "spanish") :
transformation drops documents
Я пытаюсь использовать VCorpus вместо Corpus. Он не показывает мне никаких предупреждений, но стемминг также не работает.
col <- tm::VCorpus(VectorSource('patinetes eléctricos y bicicletas'))
col <- tm::tm_map(col, stemDocument, 'spanish')
col[[1]]$content
[1] "patinet eléctrico y bicicleta"
Когда я использую stemDocument('patinetes eléctricos y bicicletas', 'spanish')
результат будет:
"patinet electr y biciclet"