Unaccent строка в bash-скрипте (RHEL) - PullRequest
10 голосов
/ 27 марта 2012

В дистрибутивах на основе Debian есть утилита unaccent , которую можно использовать для удаления акцентов в акцентированных буквах в тексте.

Я искал пакет, содержащий это наRedhat дистрибутивы, но я нашел только unac , доступный только для Mandriva.

Я пытался использовать iconv , но, похоже, он не поддерживает мой случай.

Каков лучший, легкий подход, который легко использовать в скрипте bash?Есть ли какие-либо секретные опции для iconv, которые позволяют это?

1 Ответ

14 голосов
/ 27 марта 2012

Вы можете использовать опцию -c (очистить) в iconv для удаления символов, отличных от ascii:

$ echo 'été' | iconv -c -f utf8 -t ascii
t

Если вы просто хотите удалить акцент:

$ echo 'été' | iconv -f utf8 -t ascii//TRANSLIT
ete
...