Удаление непечатных символов с помощью sed не работает - PullRequest
0 голосов
/ 25 сентября 2018

Я работаю в AIX Unix и пытаюсь удалить непечатные символы из файла, когда данные отображаются в файле in Arizona w/ fiancÃÂÃÂÃÂ при просмотре в Notepad ++ с использованием кодировки UTF-8.Когда я пытаюсь просмотреть файл в Unix, она получает ^ ▒▒ ^ ▒▒ ^ ▒▒ ^ ▒▒ ^ ▒▒ ^ ▒▒

Я хочу заменить все эти специальные символы пробелом, и мой вывод должен выглядетькак in Arizona w/ fianc

Я пытался sed 's/[^[:print:]]/ /g' file, но он не удаляет эти символы. Мой язык указывается ниже, когда я запускаю locale -a

C
POSIX
en_US.8859-15
en_US.ISO8859-1
en_US

Я даже пытался sed -e 's/[^ -~]/ /g' исимволы не удаляются.

Я вижу, что ответы других стековых потоков использовали UTF-8 локаль с GNU sed, и это сработало, но у меня нет этой локали.

Также я использую ksh.

...