У меня есть датафрейм, содержащий твиты. Я работаю над удалением стоп-слов, и по этой причине я использовал:
stopWords <- stopwords("en")
tweets_sample$text<-removeWords(tweets_sample$text,stopWords)
В любом случае, я получил
Error in gsub(sprintf("(*UCP)\\b(%s)\\b", paste(sort(words, decreasing = TRUE), :
input string 1 is invalid UTF-8
Что бы объяснить такую ошибку?