Question

Я хочу получить strlen () из Shift-jis и Utf-8, а затем сравнить их.Строка может быть смешана "ああ 12345678sdfdszzz".Я пытался использовать strlen, но он дает разные результаты.mb_strlen также не помогает, потому что это смешанная строка.

Например:

ああ12345678 >> strlen() = 24 chars
ああああああああああああああああ >> strlen() = 48 chars
ああああああああああああああああああ >> strlen() = 54 chars

Кажется, что правила не существует.Итак, , как лучше всего рассчитать strlen и сравнить их в мультиязычном ?

Gumbo · Answer 1 · 13 февраля 2012

strlen учитывает только байты и, следовательно, полезно только для однобайтовых кодировок символов ;используйте mb_strlen для многобайтовых кодировок , которые вместо этого могут считать действительные символы.

Oliver M Grech · Answer 2 · 13 февраля 2012

Я бы написал функцию для проверки, откуда и где существует конкретная кодировка.

Тогда я бы разбил строку на кодировки, выполнил mb_strlen и суммировал размеры после слов. Затем повторите на второй строке и сравните.

Полагаю, вы понимаете мою мысль;)

PS: использовать mb_detect_encoding для обнаружения кодировки

mb_detect_encoding (дальнейшие идеи сообщества php см. В комментариях)

Как strlen многоязычной строки

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как strlen многоязычной строки

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы