Я использую следующее регулярное выражение для проверки одной из моих текстовых областей:
^[a-zA-Z0-9][a-zA-Z0-9 ]+$
Как мне изменить его, чтобы разрешить следующие символы:
^[A-Za-z\d:;,\u20AC][A-Za-z\d :;,\u20AC]+$
\d
\u20AC
€
Помимо уже упомянутых выражений, вы можете использовать \p{Sc} для соответствия любому символу валюты и \p{P} для любого символа пунктуации.
\p{Sc}
\p{P}
Чтобы узнать больше классов символов, посмотрите здесь .
Довольно просто:
^[a-zA-Z0-9,;:€][ a-zA-Z0-9,;:€]+$
Как уже упоминал Тим, как правило, безопаснее не полагаться на кодировку текста исходного файла:
^[a-zA-Z0-9,;:\u20AC][ a-zA-Z0-9,;:\u20AC]+$