stemDocument плохо работает с функцией tm_map, использующей VCorpus - PullRequest
0 голосов
/ 23 апреля 2019

Когда я преобразую в R мой испанский текст в корпус, я могу применить stemDocument в функции tm_map, хотя он возвращает мне следующее предупреждение:

Warning message:
In tm_map.SimpleCorpus(col, stemDocument, "spanish") :
  transformation drops documents

Я пытаюсь использовать VCorpus вместо Corpus. Он не показывает мне никаких предупреждений, но стемминг также не работает.

col <- tm::VCorpus(VectorSource('patinetes eléctricos y bicicletas'))
col <- tm::tm_map(col, stemDocument, 'spanish')
col[[1]]$content

[1] "patinet eléctrico y bicicleta"

Когда я использую stemDocument('patinetes eléctricos y bicicletas', 'spanish') результат будет:

"patinet electr y biciclet"
...