Какие символы НЕ присутствуют в Юникоде? - PullRequest
11 голосов
/ 08 июня 2011

Я слышал, что некоторые символы не присутствуют в стандарте Unicode, несмотря на то, что они написаны в повседневной жизни населением некоторых районов.Особенно я слышал о недавних китайских именах, изготовленных путем сборки частей существующих персонажей, но я не могу найти для этого никакой ссылки.

Например, приведенный ниже символ очень распространен для 50 миллионов человек, но это отсутствует в Unicode :

enter image description here

Есть ли список таких символов?(изображения или веб-сайт с такими символами, как изображения)

Ответы [ 5 ]

6 голосов
/ 09 июня 2011

Также: вот список unicode.org неподдерживаемых сценариев

6 голосов
/ 08 июня 2011

Ну, в Unicode есть масса вещей, которых нет (хотя новые персонажи все еще добавляются).

Некоторые примеры:

  • Из-за Han Unification , Unicode использует одну кодовую точку для нескольких похожих символов из разных языков. Люди не согласны, действительно ли эти персонажи "одинаковы"; если вы считаете, что они должны быть представлены отдельно, то эти отдельные представления можно было бы назвать «отсутствующими» (хотя это вопрос философского характера).
  • Аналогичным образом, многие языки (особенно азиатские) иногда имеют несколько вариантов одного символа / глифа. Различие между «одним символом с несколькими представлениями» (= одна кодовая точка) и «различными символами» (= разные кодовые точки) является в некоторой степени произвольным, поэтому существуют случаи (например, с символами кандзи), когда некоторые люди считают, что альтернативные варианты «отсутствуют».
  • Многие исторические и редко используемые персонажи отсутствуют.
  • Многие старые / исторические сценарии не охвачены, например, Demotic . На самом деле, существует инициатива, специально предназначенная для включения большего количества сценариев в Unicode, Инициатива кодирования сценариев (SEI).

Существует также страница W3C на эту тему, Отсутствующие символы и глифы , с дополнительными пояснениями.

2 голосов
/ 08 июня 2011

Вот небольшая статья W3C о том, что делать с отсутствующими символами Unicode.

Вот документ PDF о некоторых отсутствующих символах в Unicode 4.1

А вот небольшой аккуратный юникод-навигатор.

Надеюсь, это немного поможет.

1 голос
/ 17 августа 2011

Существуют тонны символов из символьной части стандарта, которые досадно не включены.

См. Раздел "1003 *http://xahlee.org/comp/unicode_arrows.html" "Отсутствующие симметричные версии" для набора символов стрелки, которые существуют., но только в определенных направлениях.Некоторые просто глупы.Например, есть ⥂, ⥃ и ⥄, но нет правильной версии последней.

И из http://en.wikipedia.org/wiki/Unicode_subscripts_and_superscripts видно, что они, по-видимому, случайно выбрали, какие буквыподдерживать в форме супер- и субскриптов.Например, они включают в себя подстрочные гласные a, e, o и даже schwa (ə), но не i, что было бы очень полезно, так как это обычный подстрочный индекс в математическом наборе текста.Взгляните на статью в Википедии для получения более подробной информации (вам потребуется установить шрифт Unicode, потому что, по крайней мере, на момент написания этой статьи они регулярно перечисляли эквивалентные ascii, но в основном они выбрали примерно половину латинского алфавита, казалось бы,случайным образом для каждого из символов верхнего и нижнего регистра верхнего и нижнего регистра.

Кроме того, не существует большого количества символов, которые были бы удобны для построения фигур с Юникодом.

0 голосов
/ 08 июня 2011

Естественно, что Unicode не может полностью догнать некоторые новые идеографические символы или некоторые редко используемые символы.

Но я не совсем понимаю причину вопроса. Вы можете нарисовать любой случайный символ, который вам нужен, скорее всего, он не будет стандартным символом Unicode.

Или это просто любопытство?

...