Как заставить uniq различать em- и en-dash? - PullRequest
2 голосов
/ 28 октября 2011

uniq (GNU coreutils 8.5), по-видимому, не делает различий между символами em и en-dash:

$ echo -e "a – b \ na — b" | uniq -c

  2 a–b

Есть ли способ усилить это различие? Я попробовал различные настройки для LC_COLLATE без удачи.

1 Ответ

3 голосов
/ 28 октября 2011

работал для меня

echo -e "a–b\na—b" | LC_COLLATE=C uniq -c
      1 a–b
      1 a—b
...