Question

При написании переводчиков для PDF, HTML и других документов нам необходимо иметь дело с различными пробельными символами и дополнительными непечатными символами. ANSI хорошо определены, но сколько других можно найти на практике? Типичным примером является кластер в ISO10646 (я думаю):

&ensp;      &#8194;             en space
&emsp;  &#8195;             em space
&thinsp;    &#8201;             thin space
&zwnj;  &#8204;     ‌   ‌   zero width non-joiner
&zwj;   &#8205;     ‍   ‍   zero width joiner
&lrm;   &#8206;     ‎   ‎   left-to-right mark
&rlm;   &#8207;     ‏   ‏   right-to-left mark

(По понятным причинам символы не появляются выше!).

Michael Dillon · Answer 1 · 27 октября 2009

Юникод будет с нами, в возрастающем количестве, надолго. Если документ HTML или XML написан в кодировке UTF-8 в кодировке Unicode, то следует ожидать появления всех этих элементов.

В Unicode (База данных символов Unicode) следующие кодовые точки определены как пробельные символы:

U+0009–U+000D (control characters, containing Tab, CR and LF)
U+0020 SPACE
U+0085 NEL (control character next line)
U+00A0 NBSP (NO-BREAK SPACE)
U+1680 OGHAM SPACE MARK
U+180E MONGOLIAN VOWEL SEPARATOR
U+2000–U+200A (different sorts of spaces)
U+2028 LS (LINE SEPARATOR)
U+2029 PS (PARAGRAPH SEPARATOR)
U+202F NNBSP (NARROW NO-BREAK SPACE)
U+205F MMSP (MEDIUM MATHEMATICAL SPACE)
U+3000 IDEOGRAPHIC SPACE

Robert Koritnik · Answer 2 · 27 октября 2009

В мире разработки есть как минимум еще один (чаще всего используется в веб-разработке)

&nbsp;  // non-breaking space

Но чем больше вы попадаете в мир дизайна, тем больше вы видите различных пробелов / невидимых символов. Публикация программного обеспечения обычно имеет

пробел - обычный пробел
в пробел
em пробел
тонкое пространство
пространство для волос
неразрывный пробел
неразрывное пространство фиксированной ширины
шестой пробел
четверть пространства
третье место
пунктуация
заполняющее пространство
цифра
...

Сколько непечатных символов обычно используется?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Сколько непечатных символов обычно используется?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы