gsub неправильно идентифицирует [: cntrl:] - символы - PullRequest
0 голосов
/ 06 января 2019

Я импортировал текст из .csv, который закодирован в UTF-8 - или так мне говорит Excel. Теперь у меня есть конкретная строка текста: mystring="drück dir die Daumen", и я подозреваю, что в ней есть управляющие символы ASCII. Поэтому я использую gsub("[:cntrl:]", "XX", "Ich drück dir die Daumen") и получаю "dXXüXXk diXX die DaumeXX", что неправильно. Я проверил, является ли строка UTF-8 в кодировке Encoding(mystring), что фактически дало мне UTF-8.

Это актуально для меня, потому что мне нужно идентифицировать знаки препинания. Но когда я пытаюсь заменить, например, ) в строке (скажем, "a) this is an enumeration"), gsub() не снимает скобку.

Боюсь, что проблема не может быть воспроизведена ... Любая помощь по-прежнему приветствуется.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...