Я пытаюсь понять, как точно манипулировать символами и наборами символов в UNIX, учитывая наличие различных локалей - и делаю это, не требуя специальных инструментов вне стандартных элементов UNIX.
Мое исследование показало мне проблему немецкого характера: один персонаж превращается в два - и другие проблемы. Использование tr, по-видимому, очень плохая идея. Единственная альтернатива, которую я вижу, это:
echo StUfF | perl -n -e "print lc($_);"
но я не уверен, что это сработает, и для этого нужен Perl - не плохое требование обязательно, но очень большой молоток ...
А как насчет awk, grep, sed и ...? В этом и заключается мой вопрос: как я могу быть уверен, что текст будет в нижнем регистре в каждой локали?