LibreOffice Преобразование HTML в PDF, символ заканчивается на & zwj; не преобразован должным образом - PullRequest
0 голосов
/ 16 ноября 2018

Мы используем LO 5.4 для конвертации HTML в PDF через UNO API.Он отлично работает для большинства языков, но один конкретный язык, т.е. малаялам, имеет несколько символов (называемых chillu), которые имеют представление, заканчивающееся на with (Zero Width Joiner).

  1. Когда мы конвертируем эти символы, гдемы явно применяем семейство шрифтов малаялам, тогда с преобразованием все в порядке.например, <span style="font-family:Meera">ന്&zwj;</span>

    Здесь символ преобразуется, как и ожидалось, т.е. ന്‍

  2. Но когда содержимое не имеет семейства шрифтов и наследует основаниесемья из HTML тела, которое является английским (например, Verdana), то символ не будет преобразован должным образомнапример, <span>ന്&zwj;</span>

    В этом случае вывод будет ന് вместо ന്‍ , хотя шрифт, встроенный для отображения этого слова, является тем же самым, то есть Меера

Может кто-нибудь пролить свет на то, как это работает.

...