Нет полного списка всех символов Unicode вместе с их словесными описаниями, даже нет списка их с именами Unicode. Файлы UnicodeData.txt в общем относятся к большому диапазону символов, например,
4E00;<CJK Ideograph, First>;Lo;0;L;;;;;N;;;;;
9FCB;<CJK Ideograph, Last>;Lo;0;L;;;;;N;;;;;
и
AC00;<Hangul Syllable, First>;Lo;0;L;;;;;N;;;;;
D7A3;<Hangul Syllable, Last>;Lo;0;L;;;;;N;;;;;
Можно было бы построить полный список с именами Юникода, но какова будет цель? Имена Unicode, такие как COMBINING PALATALIZED HOOK НИЖЕ, являются идентификаторами, а не описаниями. Взятые как английские тексты, некоторые из них интуитивно понятны, некоторые очень расплывчаты, некоторые неясны, а некоторые совершенно неверны - и никогда не будут изменены из-за принципа стабильности. Принцип во многом обусловлен использованием имен Unicode в программах; они не должны быть изменены по тем же причинам, по которым номера Unicode не должны изменяться.
Некоторые из названий Unicode для диакритических знаков также вводят в заблуждение или по крайней мере неполны. Форма диакритического знака не может быть выведена из одного только имени Unicode, и форма может даже сильно отличаться (например, t с caron - это ť в нижнем регистре, с диакритическим символом, похожим на конну, тогда как соответствующая заглавная буква Ť имеет .. ... хорошо, как у Caron, как у Caron).
Использование таких символов, как U + 0319 и U + 0321, в текстовых данных означает, что потребуется относительно обширный шрифт и относительно продвинутого программного обеспечения для рендеринга, которое хорошо отображает комбинацию диакритических знаков. Более того, если вы намереваетесь использовать их в значениях и контекстах, для которых они не предназначены (они предназначены для использования в фонетических обозначениях, где они связаны с буквами для обозначения особенностей произношения), вам может потребоваться программное обеспечение плохое который реализует их ненадлежащим образом (с учетом предполагаемого использования и рендеринга). Например, U + 0319 должен появиться ниже буква