Я импортировал текст из .csv, который закодирован в UTF-8 - или так мне говорит Excel. Теперь у меня есть конкретная строка текста: mystring="drück dir die Daumen"
, и я подозреваю, что в ней есть управляющие символы ASCII. Поэтому я использую gsub("[:cntrl:]", "XX", "Ich drück dir die Daumen")
и получаю "dXXüXXk diXX die DaumeXX"
, что неправильно.
Я проверил, является ли строка UTF-8 в кодировке Encoding(mystring)
, что фактически дало мне UTF-8
.
Это актуально для меня, потому что мне нужно идентифицировать знаки препинания. Но когда я пытаюсь заменить, например, )
в строке (скажем, "a) this is an enumeration"
), gsub()
не снимает скобку.
Боюсь, что проблема не может быть воспроизведена ... Любая помощь по-прежнему приветствуется.