Как я могу иметь дело с кодовыми точками Unicode? - PullRequest
1 голос
/ 24 августа 2011

Допустим, пользователь отправляет комментарий, и я хочу получить массив кодовых точек Unicode с его значением, выбрать недопустимые кодовые точки, отбросить их и сохранить комментарий. Как я могу это сделать?

, например

Пользователь отправляет "привет", и я хочу получить массив $codepoints со следующими значениями:

$codepoints[0] = 0068
$codepoints[1] = 0065
$codepoints[2] = 006C
$codepoints[3] = 006C
$codepoints[4] = 006F

И по какой-то странной причине я не хочу разрешать букву "l", поэтому я хочу отбросить символы с кодовой точкой U + 006C. Таким образом, сохраненный комментарий будет "heo". Это вообще возможно?

Заранее спасибо!

1 Ответ

2 голосов
/ 24 августа 2011

Вот пример с литералами Юникода.

mb_internal_encoding('utf-8');
mb_regex_encoding('utf-8');
echo mb_ereg_replace('[•]', '', '•T•e•s•t•');

Это выведет строку Test.

Если вы предпочитаете писать кодовые точки в шестнадцатеричном формате, этот ответ может быть полезен.

...