Хотя регулярные выражения JavaScript распознают символы не ASCII в некоторых случаях (например, \s
), это безнадежно неадекватно, когда дело доходит до \w
и \b
.Если вы хотите, чтобы они работали с чем-либо, кроме символов слова ASCII, вам придется использовать другой язык или установить библиотеку Стива Левитана XRegExp с плагином Unicode .
Кстати, в вашем регулярном выражении есть ошибка.У вас есть \b
после дополнительной запятой, но она должна быть впереди:
"\\b([a-z]{2})\\b,?"
Я также снял квадратные скобки;они понадобятся вам только в том случае, если в регулярных выражениях запятая будет иметь особое значение, а это не так.Но я подозреваю, что вам вообще не нужно ставить запятую;\b
должно быть достаточно, чтобы убедиться, что вы в конце слова.И если вам не нужна запятая, вам также не нужна группа захвата:
"\\b[a-z]{2}\\b"