Я использую awk (mac os x) для печати только строк длиной не более n символов.
Если я попробую его в текстовом файле (strings.txt), который выглядит следующим образом:
four
foo
bar
föö
bår
fo
ba
fö
bå
И я запускаю этот awk-скрипт:
awk ' { if( length($0) >= 3 ) print $0 } ' <strings.txt
Вывод:
four
foo
bar
föö
bår
fö
bå
(последние две строки не должны были печататься).Кажется, что слова, содержащие умлаут-символы (å, ä, ö ...), считаются двумя символами.
(входной файл сохраняется в формате UTF8.)