Какой символ Юникода используется для обозначения сочетания символов? - PullRequest
12 голосов
/ 08 февраля 2010

Мое приложение должно отображать «осиротевшие» сочетания символов. Я хотел бы использовать тот же формат, что и в «официальных» диаграммах Юникода, используя заполнитель из пунктирного круга. Смотрите, например:

Быстрое сканирование по графикам, и я нашел U + 25CC "DOTTED CIRCLE". Это выглядит хорошо, но записка на этом персонаже гласит:

обратите внимание, что ссылочный глиф для этого персонаж намеренно больше, чем пунктирный круг глиф используется для указать комбинацию символов в этом стандарт; см., например, 0300

Который говорит (я думаю), что U + 25CC не правильный символ. (Или, если это так, возможно, просто плохо сформулированная записка.)

Итак: если пунктирный круг, использованный на «Объединении диакритических меток», не является U + 25CC, какой код будет правильным для этого маленького бугера?

Я пробовал:

  • Копирование текста из PDF и проверка его, но в PDF копия отключена.
  • Отправьте его мне в Gmail по электронной почте, а затем просмотрите вложение в формате HTML, но оно преобразуется в U + 0024 («ЗНАК ДОЛЛАРА»). Это означает, что преобразование либо не удалось, либо они просто играют в некоторые игры рендеринга шрифтов в PDF.

[Уточнение] Я понимаю, что U + 25CC выглядит нормально (при условии, что его поддерживает шрифт), но похоже, что спецификация говорит, что это неправильный символ. Многие символы Юникода имеют похожие символы, но являются семантически разными символами. «Латинская заглавная буква A» (U + 0041) и «Греческая заглавная буква альфа» (U + 0391) будут выглядеть одинаково для большинства шрифтов, но они имеют разные смысловые значения и не являются взаимозаменяемыми.

Ответы [ 2 ]

6 голосов
/ 09 февраля 2010

Я не думаю, что является официальным символом-заполнителем. По тому, как я прочитал эту заметку, они выбрали U+25CC произвольно, исключительно для демонстрации. Затем на диаграмме , где указан «настоящий» пунктирный круг, они сделали его немного больше, чтобы подчеркнуть, что он не используется в качестве заполнителя там. (Или, может быть, они сократили ее в других таблицах; как вы сказали, записка плохо сформулирована.)

В любом случае, я не вижу причин, чтобы не использовать U+25CC в качестве вашего заполнителя.

2 голосов
/ 09 февраля 2010

Только что попробовал: создайте пустой файл .html, скопируйте текст и загрузите в Firefox. Отображается как ожидалось (хотя я действительно не ожидал, что пробел + объединение символов будут отображаться правильно):

<html>
<body>
<font size="24pt">
&#x25CC;&#x0300;
&#x25CC;&#x0301;
&#x25CC;&#x0302;
&#x25CC;&#x0303;
<br/>
&#x0041;&#x0300;
&#x0041;&#x0301;
&#x0041;&#x0302;
&#x0041;&#x0303;
<br/>
&#x0020;&#x0300;
&#x0020;&#x0301;
&#x0020;&#x0302;
&#x0020;&#x0303;
</font>
</body>
</html>
...