Я работаю в AIX Unix и пытаюсь удалить непечатные символы из файла, когда данные отображаются в файле in Arizona w/ fiancÃÂÃÂÃÂ
при просмотре в Notepad ++ с использованием кодировки UTF-8.Когда я пытаюсь просмотреть файл в Unix, она получает ^ ▒▒ ^ ▒▒ ^ ▒▒ ^ ▒▒ ^ ▒▒ ^ ▒▒
Я хочу заменить все эти специальные символы пробелом, и мой вывод должен выглядетькак in Arizona w/ fianc
Я пытался sed 's/[^[:print:]]/ /g' file
, но он не удаляет эти символы. Мой язык указывается ниже, когда я запускаю locale -a
C
POSIX
en_US.8859-15
en_US.ISO8859-1
en_US
Я даже пытался sed -e 's/[^ -~]/ /g'
исимволы не удаляются.
Я вижу, что ответы других стековых потоков использовали UTF-8
локаль с GNU sed, и это сработало, но у меня нет этой локали.
Также я использую ksh
.