Получение ошибки для DocumentTermMatrix в R - PullRequest
0 голосов
/ 20 апреля 2020

Мой предыдущий код был таким, как показано ниже -

corpus <- VCorpus(VectorSource(final_data$comment))
corpus <- tm_map(corpus, content_transformer(tolower))
corpus <- tm_map(corpus, removeNumbers)
corpus <- tm_map(corpus, removePunctuation)
corpus <- tm_map(corpus, removeWords, stopwords())
corpus <- tm_map(corpus, stemDocument)
corpus <- tm_map(corpus, removeWords, 'brw')
corpus <- tm_map(corpus, removeWords, 'cid')
corpus <- tm_map(corpus, stripWhitespace)
corpus <- tm_map(corpus, trimws)
dtm <- DocumentTermMatrix(corpus)

Я получаю следующую ошибку в последней команде (DocumentTermMatrix) -

'не применен метод для' meta ' к объекту класса "персонаж" '

Не могли бы вы дать мне знать, как это исправить?

1 Ответ

0 голосов
/ 20 апреля 2020

Использование этой строки кода вызывает проблему tm_map(corpus, trimws). Результатом является символьная строка вместо документа. Это портит корпус. Если вы хотите использовать другую функцию в tm_map, которая не является частью пакета tm, вам нужно использовать функцию content_transformer.

Если вы измените свою последнюю строку кода на приведенную ниже, она должна работать.

corpus <- tm_map(crude, content_transformer(function(x) trimws(x)))
dtm <- DocumentTermMatrix(corpus)
...