удаление многобайтовых символов из файла с помощью sed - PullRequest
4 голосов
/ 19 августа 2010

Мне нужно удалить все многобайтовые символы из файла, я не знаю, что это такое, поэтому мне нужно охватить весь диапазон.

Я могу найти их, используя grep, вот так: grep -P "[\ x80- \ xFF]" 'myfile'

Попытка сделать симуляцию с помощью sed, но вместо этого удалить их.

Приветствия

Ответы [ 2 ]

4 голосов
/ 19 августа 2010

Попробуйте:

LANG=C sed 's/[\x80-\xFF]//g' filename
0 голосов
/ 19 августа 2010

вы можете использовать iconv для преобразования из одной кодировки в другую

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...