Как я могу получить Sed to Split на персонаже Unicode на Mac? - PullRequest
1 голос
/ 31 января 2012

У меня есть документ журнала, в котором строка для разделения столбцов - это просто символ \ x01 (не соответствует чему-либо реальному в Юникоде, поэтому это безопасно).Когда я запускаю следующую фразу «Это \ x01» в окне CentOS, я получаю:

cat ~/temp1 | sed s/\x01/meh/
this is meh

На Mac я получаю:

cat ~/temp1 | sed s/\x01/meh/
this is  

Что идентичночтобы попытаться перехватить оригинал.

В качестве альтернативы, запуск на одном компьютере Perl one liner на этом компьютере:

cat ~/temp1 | perl -e 'while ( my $line = <>) {$line =~ s/\x01/meh/g; print $line;}'

дает мне:

this is meh

Итак,мой вывод до сих пор заключается в том, что sed на Mac по какой-то причине ненавидит юникод.У кого-нибудь есть идеи, почему / как это исправить?

1 Ответ

2 голосов
/ 31 января 2012

Используйте GNU sed из пакета MacPorts gsed .

Редактировать: Документация по GNU sed: здесь .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...