Сопоставление имени Unicode с регулярным выражением JavaScript - PullRequest
3 голосов
/ 06 апреля 2011

В JavaScript мы можем сопоставлять отдельные кодовые точки Unicode или диапазоны кодовых точек, используя escape-последовательности Unicode, например:

"A".match(/\u0041/) // => ["A"]
"B".match(/[\u0041-\u007A]/) // => ["B"]

Но как мы можем создать регулярное выражение для соответствия собственному имени, которое должно включать любой Unicode"письмо" с помощью регулярного выражения JavaScript?Есть ли диапазон букв?Специальная последовательность регулярных выражений или класс символов в JavaScript?

Скажите, что мой веб-сайт должен проверять имена, которые могут быть на латинских языках, а также иврит, кириллица, японский (катакана, хирагана и т. Д.), Это возможно в JavaScriptили это единственный разумный выбор для делегирования на внутренний язык с лучшей поддержкой Unicode?

Ответы [ 2 ]

5 голосов
/ 06 апреля 2011

Вот плагин JS, который добавляет поддержку Unicode к RegEx

http://xregexp.com/plugins/

0 голосов
/ 07 апреля 2011

Я использую для определения Unicode символов этого сайта http://www.fileformat.info.

Блоки Unicode (Базовая латиница, +, кириллица, +, арабский и другие): http://www.fileformat.info/info/unicode/block/index.htm

Категории символов Unicode (это не работает в JS): http://www.fileformat.info/info/unicode/category/index.htm

Буквы (A-я): http://www.fileformat.info/info/unicode/char/a.htm

Шрифты (какие символы поддерживаются в каждом шрифте): http://www.fileformat.info/info/unicode/font/index.htm

Индекс для всего вышеперечисленного http://www.fileformat.info/info/unicode/index.htm

...