Как я могу создать буквенно-цифровой Regex для всех языков? - PullRequest
11 голосов
/ 14 июля 2011

У меня была эта проблема сегодня:

Это регулярное выражение соответствует только английскому языку: [a-zA-Z0-9].

Если мне нужна поддержка какого-либо языка в этом мире, какое регулярное выражение я должен написать?

1 Ответ

9 голосов
/ 14 июля 2011

Если вы используете сокращения класса символов и механизм регулярных выражений с поддержкой Юникода, вы можете сделать это.Класс \w соответствует «символам слова» (буквам, цифрам и символам подчеркивания).

Остерегайтесь некоторых разновидностей регулярных выражений, которые делают это не так хорошо: JavaScript использует ASCII для \d (цифры) и\w, но Unicode для \s (пробел).XML делает это наоборот.

...