Если вы имеете в виду любые буквы в любой кодировке символов, то хорошим подходом может быть удаление не букв, таких как пробелы \s
, цифры \d
и других специальных символов, таких как:
[!@#\$%\^&\*\(\)\[\]:;'",\. ...more special chars... ]
Или используйте отрицание вышеупомянутого отрицания для непосредственного описания любых букв:
\S \D and [^ ..special chars..]
Плюсы:
- Работает со всеми вкусами регулярных выражений.
- Легко писать, иногда экономит много времени.
Минусы:
- Длинно, иногда не идеально, но кодировка символов также может быть нарушена.