Я видел различные сообщения об удалении специальных символов в R (например, этот: Удалить все специальные символы из строки в R? ), но ни одна из стратегий не сработала для моей проблемы.
У меня есть стенограмма, которую я читаю, с помощью qdap read.transcript ().Когда я читаю в документе, строки со специальными символами выглядят так:
If anyone knows how to simply change these special characters (i.e <e1><b8><9d> to e), again please feel free to update!
Я пробовал:
ATL1$X2 <- gsub("[^0-9A-Za-z///,.?()' ]", "", ATL1$X2)
If anyone knows how to simply change these special characters (i.e e1b89d to e), again please feel free to update
Но это не удаляет специальные символы, а также удаляетthe!
Я также пытался:
str_replace_all(ATL1$X2, "[^[:alnum:]]", " ")
If anyone knows how to simply change these special characters i e e1 b8 9d to e again please feel free to update
Но это еще хуже, удаляет все знаки препинания и все еще не решает мою проблему.
Наконец, у меня естьтакже попробовал:
iconv(ATL1$X2, from = 'UTF-8', to = 'ASCII//TRANSLIT')
If anyone knows how to simply change these special characters (i.e <e1><b8><9d> to e), again please feel free to update!
Но здесь тоже ничего не изменилось.
В идеальном мире вывод будет выглядеть так:
If anyone knows how to simply change these special characters (i.e e e e to e), again please feel free to update!
Таким образом, специальные символычитаются как то, что они «должны» быть.Если это невозможно, я, честно говоря, был бы в порядке, если бы он просто удалил специальные символы (но не другие символы, такие как восклицательные знаки) и выглядел так:
If anyone knows how to simply change these special characters (i.e to e), again please feel free to update!
Спасибо!