Хороший вопрос, вы с этим справились?
Я получаю ту же ошибку только с тем кодом, который у вас есть.Но если вы будете следовать примеру с самого начала (т. Е. Преобразования заголовка в стр. 1 ) и создать корпус и преобразовать его в простой текстовый документ, тогда вы избежите ошибки Java.Я предполагаю, что пример кода в руководстве предполагает, что вы уже выполнили эти два шага.
Тем не менее, когда я проверяю результаты, на самом деле нет никаких оснований ... Я могу 't даже получить простой пример @ user813966 для stemDocument, чтобы сделать любой stemming.Вместо этого я смотрю на пакеты RStem и SnowBall.
Тем временем, мой пакетный инструмент - пакет Python NLTK .
Обновление : я получил работающую функцию stemDocument, добавив language = "english"
следующим образом:
a <- tm_map(a, stemDocument, language = "english")
Таким образом, полный ответ на ваш вопрос состоит в том, чтобы выполнить все шаги ввода текста в R в соответствии с пакетом tm.Вам также понадобится rJava (и для установки переменных среды для JAVA_HOME в каталог, содержащий каталог jre, если вы работаете в windows), чтобы работа stemDocument