Юникод строчные буквы? - PullRequest
3 голосов
/ 30 мая 2009

Я где-то читал, что в Юникоде есть символы , отличные от , кроме A-Z, которые имеют строчный эквивалент. Что бы это могло быть, и зачем любому другому символу нужны прописные и строчные буквы?

Ответы [ 5 ]

9 голосов
/ 30 мая 2009

Английский язык, и даже этот странный вариант, американский английский :-), не единственный язык на планете. Есть некоторые очень странно выглядящие (по крайней мере, для тех, кто знаком с латинскими символами), но даже у латинских есть небольшие вариации.

Два из которых я знаю более чем случайно - греческий и немецкий:

Αα Ββ Γγ Δδ Εε Ζζ  Ηη Θθ Ιι Κκ Λλ Μμ
Νν Ξξ Οο Ππ Ρρ Σσς Ττ Υυ Φφ Χχ Ψψ Ωω

Aa Ää Bb Cc Dd Ee Ff Gg Hh Ii Jj Kk Ll Mm Nn
Oo Öö Pp Qq Rr Ss ß  Tt Uu Üü Vv Ww Xx Yy Zz

Вот почему нам не разрешено использовать биты кода, такие как:

char lower = upper - 'A' + 'a';

больше. Подобные действия в компании, которая серьезно относится к i18n, являются основанием для увольнения. Лучше всего использовать функции типа toLower()/toUpper() с поддержкой Unicode.

3 голосов
/ 10 декабря 2012

Заглавная буква ß не нужна в немецком языке, потому что буква никогда не используется в качестве первой буквы имени или слова. В остальном, в некоторых языках (французском?) Акцентированные символы в верхнем регистре не используются, только не акцентированный вариант.

3 голосов
/ 30 мая 2009

Существует много алфавитов, кроме обычного западноевропейского алфавита латинского происхождения, который большинство из нас привыкли видеть здесь. Для начала вам понадобятся прописные и строчные версии букв с акцентированными буквами и лигатур, например, Аа, IJij и т. Есть также полноформатные версии латинских символов, используемые при настройке документов на азиатских языках (которые мне лень искать). Кроме того, в настоящее время используются другие алфавиты, такие как кириллица (Бб) и греческий (Δδ).

Есть также Турция, которая просто сложная , согласно Джеффу Этвуду. Использование функций верхнего и нижнего регистров, предоставляемых вашей средой, (как правило) является способом использования данных, вводимых пользователем.

2 голосов
/ 30 мая 2009

Любая буква с акцентом может потенциально иметь другую кодовую точку или быть комбинацией более чем одной кодовой точки. Например, Â - символы в верхнем регистре с эквивалентами в нижнем регистре.

Ключ в том, чтобы добросовестно внедрять стандарты в соответствии с настройками региональных настроек ваших пользователей или получить тот же эффект, используя системные библиотеки, которые правильно обрабатывают общий случай toupper () / tolower ().

1 голос
/ 24 января 2017

в некоторых языках (французский?) Символы с заглавными буквами не используются (...)
[Райнер Бейклс - 10.12.12 в 19:34]

Ну да ... но нет!

В старые добрые времена ручного создания шрифтовых страниц это было правдой. Поскольку выделенная заглавная буква (например, «É») слишком высоко поднимается на линии, обычной практикой было игнорировать ее, вместо этого просто отображая «E». Тогда «des études» обычно появлялись как «DES ETUDES» (без акцента).

Но это больше не рекомендуется. Всякий раз, когда кто-то может редактировать / печатать / публиковать выделенные заглавные буквы, нам предлагается это сделать. Официальный квебекский "Office de la langue française" фактически продвигает это уже более двух десятилетий!

Это становится особенно важным в нашу эру компьютеров и Интернета, где тексты все больше и больше обрабатываются (читаются и переводятся) машинами. Пропуск акцентов может полностью изменить смысл. tache (пятно) -vs- tache (задание), du (of) -vs- dû (то, что вы должны заплатить) и еще много других слов. Продолжать опускать акценты в верхнем регистре - определенно не очень хорошая идея (хотя наследие вековой давности). Использование их везде, где это возможно, теперь намного лучше.

...