Я использую пакет R tm для анализа текста в группе facebook и обнаружил, что функция удаления слов не работает для меня. Я пытался объединить французские стоп-слова со своими, но они все еще появляются. Поэтому я создаю файл с именем «french.txt» со своим собственным списком, как в следующей команде:
nom_fichier <- "Analyse textuelle/french.txt"
my_stop_words <- readLines(nom_fichier, encoding="UTF-8")
Вот данные для интеллектуального анализа текста:
text <- readLines(groupe_fb_ief, encoding="UTF-8")```
docs <- Corpus(VectorSource(text))
inspect(docs)
ВотКоманды tm_map:
docs <- tm_map(docs, tolower)
docs <- tm_map(docs, stripWhitespace)
docs <- tm_map(docs, removePunctuation)
docs <- tm_map(docs, removeNumbers)
docs <- tm_map(docs, removeWords, my_stop_words)
Применяя это, он все еще не работает, и я не понимаю, почему. Я даже пытаюсь изменить порядок команд без результата.
У вас есть идеи? Можно ли изменить французские стоп-слова в R? Где находится этот список?
Спасибо !!