Я не могу ответить на вопрос о том, что он указан как поддерживаемый и не поддерживаемый, это, вероятно, вопрос для людей, работающих на сайте fileformat.info.
UTF-8 может использоваться для представления любой символ Unicode (кодовая точка).Это верно для всех UTF.Количество байтов, необходимых для этого, варьируется (например, в UTF-8 вам нужно четыре для обозначенной вами кодовой точки, тогда как вам нужен только один для римской буквы «A»), но все символы Unicode могут быть представлены каквсе UTF.Вот для чего они.( Подробнее здесь .)
Звучит так, как будто вы столкнулись с проблемой кодирования на одном (или нескольких) слоях в вашем приложении.Первое место, которое нужно посмотреть, - это страница, обслуживаемая вашим приложением: в нем указано, какая кодировка используется?Возможно, стоит проверить заголовки, возвращаемые для ваших страниц, чтобы увидеть, имеют ли они:
Content-Type: text/html; charset="UTF-8"
... в них.Если они этого не делают, поищите эквивалентный тег meta
в самом HTML, хотя я, кажется, вспоминаю, что чтение meta
не является хорошим способом сделать это.Если заголовки не являются конкретными, по умолчанию применяется ISO-8859-1 (хотя некоторые браузеры могут использовать Windows-1252 вместо), что не будет работать, если ваш исходный тексткодируется UTF-8.
Следующее место, которое нужно посмотреть, это ваша база данных.Я не думаю, что MySQL хранит текст в UTF-8 по умолчанию, вам нужно убедиться, что он делает это в вашей конфигурации MySQL.
Исходя из вашего вопроса, я не думаю, что you нужно, но я закончу с обязательной заглушкой для статьи Абсолютный минимум каждый разработчик программного обеспечения Абсолютно, положительно должен знать о Unicode и наборах символов (никаких оправданий!) Джоэл Спольски (хотя бы, чтобы спасти кого-то от включения его в комментарии).: -)