Стоп-слова не могут удалять слова в R - PullRequest
0 голосов
/ 08 января 2020

Я пытался удалить слова, используя текст, содержащий стоп-слова. Но это происходит.

library(corpus)
library(tm)
tokpedClean <- read.csv("D:/AS/tokpedClean5.csv")
head(tokpedClean)
tokpedCleanCor = Corpus(VectorSource(tokpedClean$text))

removeURL <- function(x) gsub("http[^[:space:]]*", "", x)
docsClean <- tm_map(docs, removeURL)
inspect(docsClean[1:5])

И другая предварительная обработка, а также токенизация.

tokenizer=function(x) strsplit(x, split = ' ')
docsClean=tm_map(docsClean, tokenizer)
inspect(docsClean[1:5])

Следующий шаг - стоп-слова

cStopwordID <- readLines("D:/AS/swID.csv")
stop <- tm_map(docsClean, removeWords, cStopwordID)

Но консоль показывает это

Ошибка в UseMethod ("removeWords", x):

нет применимого метода для removeWords, примененного к объекту класса "list"

Я пытался преобразовать в фрейм данных, но все еще ошибка

Ошибка в UseMethod ("removeWords", x):

нет применимого метода для «removeWords» применяется к объекту класса «фрейм данных»

Что мне делать?

...