Как правильно считать символы UTF-8, а также смайлики и специальные символы различной длины? - PullRequest
0 голосов
/ 13 ноября 2018

Я просто хочу задать действительно запутанный вопрос и получить действительно простой ответ о том, как все это работает, в основном моя проблема заключается в том, когда я считаю длины символов в JavaScript и PHP для символов и смайликов, таких как ?‍❤️‍?‍? it появляется 11 символов вместо того, что я считаю 1 в «истинной длине».

Мне бы хотелось, чтобы код для PHP и JavaScript просто подсчитывал «истинную длину», которую человек видел бы для КАЖДОГО символа, читаемого компьютером (если это имеет смысл), поэтому для всех символов / символов UTF-8 и смайликов.

Я пытался использовать strlen, но он учитывает только байты, а не символы, я думаю. Я также пробовал mb_strlen, но это не учитывает истинную длину для смайликов.

Спасибо, я также был бы признателен за простое объяснение того, как эта система кодирования / юникода работает для символов разной длины с учетом символов из других языков, например. французский / древнееврейский.

ура!

...