Попытка запустить tm на R, и я не могу избавиться от – как строки.Я пробовал "–, "â€\“", '–'.Попытка включить строку в myStopwords <- c("issu","base","...")
tm
–
"–
"â€\“"
'–'
myStopwords <- c("issu","base","...")
Мы можем использовать gsub для удаления определенного слова:
gsub
string ="– test – data –" # This is your sample input gsub("–","",string) # Remove †from your string
Вывод:
[1] " test data "
Попробуйте gsub использовать функцию замены символов, кроме печатаемых символов: [:alnum:], [:punct:] и space gsub("[^[:print:]]"," ",text)
[:alnum:]
[:punct:]
space
gsub("[^[:print:]]"," ",text)