Стандарт ECMA 262 v3, который определяет язык программирования, широко известный как JavaScript, предусматривает, что \w
должен быть эквивалентен [a-zA-Z0-9_] и что \d
должен быть эквивалентен [0-9 ]. \s
, с другой стороны, соответствует пробелам ASCII и Unicode в соответствии со стандартом.
JavaScript также не поддерживает синтаксис \p
для сопоставления Unicode-объектов, поэтому нет хорошего способа сделать это. Вы можете сопоставить все ивритские символы с:
[\u0590-\u05FF]
Это просто соответствует любой кодовой точке в блоке иврита.
Вы можете сопоставить любой символ слова ASCII или любой символ иврита с:
[\w\u0590-\u05FF]