Лучшая практика для обработки / дезинфекции имен пользователей (ударения, пунктуация, ...)? - PullRequest
3 голосов
/ 28 июля 2010

Что бы вы порекомендовали в качестве наилучшей практики для обработки или очистки имен пользователей? Во Франции, Испании, Греции, ... даже для ограничения латинского алфавита, вы получите периоды, тире, апострофы, ....

Что мы делаем, так это получаем информацию из API Facebook. Мы получаем имя пользователя, если пользователь его установил, в противном случае мы берем имя и преобразуем его в имя пользователя (например, для входа в систему позже). У нас есть такие вещи, как Клеман, Д'Акинн, Джон М. Марч, Энн-Софи Бласс, ... вы знаете, что делать.

Как вы справились с этим?

1 Ответ

4 голосов
/ 28 июля 2010

Полная поддержка юникода в именах пользователей.

Если вы беспокоитесь о олицетворении, использующем символы Юникода, вы можете отобразить автоматически сгенерированный визуальный ключ (очень похоже на новые учетные записи пользователей, но без замены значка пользователя) рядом с именем.

Если вам все еще нужно сократить диапазон ASCII, вы можете использовать стандартные инструменты для нормализации текста в Юникоде.Они работают на основе различных принципов эквивалентности Юникода: http://en.wikipedia.org/wiki/Unicode_equivalence

Возможно, стоит принять во внимание символы в диапазоне Юникода для людей, которые идентифицируют себя со своими диакритическими знаками, но не принимать учетную запись пользователя,имеет ту же нормализованную форму, что и существующая.Т.е. вы можете настроить / user / clément, что запретит создание / user / clement и /user/clëment.

...