Что такое селектор вариаций Unicode? - PullRequest
7 голосов
/ 12 февраля 2011

Мне было интересно. Для чего используются переключатели Unicode Variation U-FE00 - U-FE0F.

Пример: ︀︁︂︂

Ответы [ 3 ]

7 голосов
/ 12 февраля 2011

Стандарт Unicode говорит об этом. Вот немного соответствующего раздела из 3.2.0, приложение 28 (я уверен, что есть более свежие версии; это первая, что я нашел):

Символы Юникода могут быть представлены различными символами, как обсуждалось в Главе 2, Общая структура в стандарте Юникод, версия 3.0. Иногда при обработке текста возникает необходимость ограничить или изменить набор глифов, которые должны использоваться для представления символа. Обычно такие изменения обозначаются выбором шрифта или стиля в документах форматированного текста. В особых обстоятельствах такое отклонение от нормального диапазона внешнего вида должно быть выражено бок о бок в одном и том же документе в контексте простого текста, где невозможно или неудобно обмениваться форматированным текстом. Например, в языках, использующих монгольский алфавит, иногда требуется определенный диапазон вариантов глифов для конкретной текстовой цели, для которой диапазон «общих» символов считается неуместным. Селекторы вариаций используются, когда символы имеют практически одинаковую семантику.

Селекторы вариаций предоставляют механизм для указания ограничения на набор глифов, которые используются для представления определенного символа. Они также предоставляют механизм для определения вариантов, таких как для CJK Ideographs и Mongolian, которые имеют практически одинаковую семантику, но имеют существенно разные диапазоны глифов. Последовательность вариаций, которая всегда состоит из базового символа, за которым следует селектор вариаций, может быть указана как часть стандарта Unicode. Эта последовательность называется вариантом базового символа. Селектор вариаций влияет только на внешний вид базового символа * и только на последовательности вариаций, определенные в настоящем стандарте. Селектор вариантов не используется в качестве общего механизма расширения кода.

(это продолжается ...)

Вас также могут заинтересовать Стандартизированные варианты (на этот раз с 6.0.0).

3 голосов
/ 05 мая 2014

Ваше предположение так же хорошо, как и мое .. но согласно этому источнику ...

enter image description here

получил это ...

Подсказки по кодированию символов Emoji: 1 В iOS 5 / OSX 10.7 был изменен базовый код, который Apple OS генерирует для этого смайлика. был немного изменен в iOS 7 / OSX 10.9 (добавлено variation selector), чтобы было легче идентифицировать и отображать этот эмодзи в OSX и iOS. Мы не против Apple, спасибо! Мы просто любим наших смайликов!

Их диаграмма продолжает отмечать, что эта «новая» версия после 10.9

имеет UTF-8 Character Count из 2 против предыдущего 1 ... если это поможет.

1 голос
/ 12 февраля 2011

Диапазон выбора вариантов был введен в версии 3.2 стандарта Unicode и расположен в плоскости 0, базовой многоязычной плоскости.Другие селекторы можно найти в Дополнении селекторов вариаций .

Большинство символов Юникода могут быть представлены широким набором глифов, а в расширенном тексте конкретный глиф может быть указан путем выбораконкретный шрифт или стиль.Этот механизм недоступен в виде простого текста, и поэтому были введены селекторы вариантов, чтобы указать, что глифы, применимые к конкретному символу, должны быть изменены или ограничены.За базовым символом следует селектор вариантов, комбинация называется последовательностью вариантов.Он не предназначен для использования в качестве механизма общего назначения, и единственные разрешенные последовательности вариантов - это те, которые определены в файле Standardized Variants , который является частью базы данных символов Unicode.

От http://www.alanwood.net/unicode/variation_selectors.html

...