Я создаю сервис, который может «выйти на международный уровень» на неанглоязычных рынках. Я не хочу ограничивать имя пользователя диапазоном символов ASCII, но хотел бы позволить пользователю указать свое «естественное» имя пользователя. Хорошо, используйте UNICODE (и скажите UTF-8 в качестве кодировки текста моего имени пользователя).
Но! Я не хочу, чтобы пользователи создавали «неименные» имена пользователей, содержащие «символьные» кодовые точки. Например, я не хочу разрешать имя пользователя, такое как √√√√√√øøøøø.
Есть ли список кодовых точек "символа" для UNICODE, который я могу проверить (возможно, с помощью регулярного выражения), чтобы принять / отклонить данное имя пользователя?
Спасибо!