UTF-8 набор символов - PullRequest
       19

UTF-8 набор символов

0 голосов
/ 06 декабря 2011

У меня есть поле формы, которое может содержать до 120 символов, а также принимать весь набор символов Unicode UTF-8, включая специальные, числовые и альфа-символы, для обозначения символов i18n. Следует игнорировать начальные и конечные пробелы

Поскольку я в основном использовал ограниченный набор ASCII, я не уверен, что будет в UTF-8.

Не могли бы вы рассказать мне об основных различиях ASCII / UTF-8 и полном наборе символов, который должен быть разрешен с учетом вышеуказанного требования.

Спасибо.

Ответы [ 2 ]

1 голос
/ 06 декабря 2011

ASCII содержит только 128 символов, а последняя версия Unicode содержит более 109 000 символов, охватывающих 93 сценария.

http://en.wikipedia.org/wiki/ASCII - полное описание ASCII

http://en.wikipedia.org/wiki/Unicode - вики-статья о Юникоде

http://unicode.org/charts/ - список диаграмм Юникода

0 голосов
/ 06 декабря 2011

Проще говоря, UTF-8 - это расширенный набор US-ASCII. Любой символ в ASCII может быть представлен в UTF-8 и с использованием тех же самых битовых представлений. UTF-8 - это одно представление Unicode, которое позволяет представлять любой определенный в данный момент символ.

...