Для некоторых примеров:
Эти символы слишком короткие или перекрывают окружающие символы:
/b5/ີ/foo
/31/ั/foo
/39/᤹/foo
/a3/ᮣ/foo
Они слишком длинные, чтобы поместиться в слот моноширинного символа:
/4b/ോ/foo
/23/ᠣ/fo
/61/ᡡ/foo
/86/ᢆ/foo
/ba/຺/foo
Тогда пустые / пробельные / невидимые символы также будут считаться теми, которые не вписываются в URL.
Интересно, есть ли простой способ выяснить, какие символы попадают в эти слоты:
- Хорошо вписывается в URL (латинские символы, китайские символы и т. Д.).
- Слишком большой для моноширинного пространства (китайские символы, приведенные выше примеры и т. Д.).
- Объединение символов или совпадений с окружающими символами URL (примеры выше).
Может быть, путем проверки какого-либо свойства символа Unicode, есть способ сказать это программно, поэтому мне не нужно проходить через каждый символиндивидуально и визуально проверьте, к какой категории он относится.
В основном я ищу, какие символы нужно либо (а) поместить на другого персонажа (гребень)начальные символы), или (b) необходимо добавить некоторые дополнительные отступы, как в примерах выше, чтобы их можно было увидеть в URL).