Как удалить неизвестные символы из строк? - PullRequest
0 голосов
/ 29 сентября 2018

Извините, если это глупый вопрос, но я попытался найти похожие проблемы и не нашел того, что искал.

Я удалил текст из Интернета и теперь пытаюсь работать с ним в R.Я столкнулся с проблемой: в некоторые слова вставлены неизвестные символы.Это выглядит нормально, когда я просто отображаю таблицу, но когда я копирую текст, появляется этот символ.Например, если ячейка в таблице «Пример», при копировании в консоль я вижу следующее:

img

Это, к сожалению, проблематично, поскольку R не распознаетслово в этих случаях и не найдет ячейку, если я, например, попытаюсь найти все ячейки, которые содержат слово «Пример».Поскольку ошибка кажется случайной и не относится только к конкретным словам, я не знаю, как ее исправить - кто-нибудь может мне помочь?

Заранее большое спасибо !!

1 Ответ

0 голосов
/ 29 сентября 2018

Вы можете использовать функцию iconv для удаления всех не-ASCII символов из строки.Пожалуйста, смотрите пример ниже:

iconv("Ex·ample", from = "UTF-8", to = "ASCII", sub = "")
# Example
...