Я пытаюсь удалить все символы Юникода из файла, кроме испанских символов.
Сопоставление разных гласных не представляет проблемы, и áéíóúÁÉÍÓÚ
не заменяются с помощью следующего регулярного выражения (но все остальныеUnicode, кажется, заменяется):
perl -pe 's/[^áéíóúÁÉÍÓÚ[:ascii:]]//g;' filename
Но когда я добавляю перевернутый вопросительный знак ¿или восклицательный знак ¡к регулярному выражению, другие символы Unicode также сопоставляются и исключаются, что я бынравится быть удаленным:
perl -pe 's/[^áéíóúÁÉÍÓÚ¡¿[:ascii:]]//g;' filename
не заменяет следующее (некоторые не пригодны для печати): ³ � �
Я что-то упускаю здесь очевидное?Я также открыт для других способов сделать это на терминале.