Это сильно зависит от языка (и движка регулярных выражений), который вы используете.
В Perl, \w
соответствует всем символам слова, независимо от языка или алфавита, и что-то вроде /\b(\w+)\b/
будет (вероятно) соответствовать испанским и английским или русским словам.
В языках, использующих PCRE, \w
(и, следовательно, вероятно, \b
) НЕ соответствуют символам Юникода. Возможно, вам нужно будет создать свой собственный набор. Я предлагаю что-то вроде [\wáéíóúñ]
(соответствует всем символам слова плюс нужные вам символы с акцентом), и библиотека PCRE должна быть предварительно собрана с поддержкой Unicode, прежде чем это сработает.
Если вы используете что-то еще, удачи. Некоторые движки регулярных выражений даже не поддерживают Unicode.