Я хочу очистить свой файл от всех символов, кроме русских и арабских букв, "|"и пробел. Начнем только с арабских букв. Итак, у меня есть:
cat file.tzt | sed 's/[^\u0600-\u06FF]//g'
sed: -e expression #1, char 21: Invalid range end.
Я пробовал [\ u0621- \ u064A] - то же самое. Я также пытался использовать {арабский}, но он вообще не очищает файлы.
Ошибка выглядит странно для меня. Очевидно, 064FF> 0621.
Итак, в целом я хочу получить что-то вроде этого:
cat file.tzt | sed 's/[^\u0600-\u06FFа-яА-Я |]//g'
И я в порядке с awk или любой другой утилитой, но, как я знаю, sed стабилени надежный.