Переполнение стека также имеет проблему с не-ASCII символами в регулярном выражении, вы можете найти его здесь .Они не справляются с границами слов, но, возможно, в любом случае дают вам полезные советы.
Есть еще одна страница , но он хочет сопоставлять строки, а не слова.
Iне знаю и не нашел сейчас якоря для вашей проблемы, но когда я вижу, какие регулярные выражения монстров используются в моей первой ссылке, ваша группа, которую вы хотите избежать, не является чрезмерной, и, на мой взгляд, вашарешение.