uniq (GNU coreutils 8.5), по-видимому, не делает различий между символами em и en-dash:
uniq
$ echo -e "a – b \ na — b" | uniq -c
2 a–b
Есть ли способ усилить это различие? Я попробовал различные настройки для LC_COLLATE без удачи.
работал для меня
echo -e "a–b\na—b" | LC_COLLATE=C uniq -c 1 a–b 1 a—b