Как WordPress заменяет хитрые символы, такие как лигатуры и цитаты из PDF - PullRequest
0 голосов
/ 27 сентября 2018

Я хочу работать непосредственно с некоторым HTML, содержащим текст, скопированный из PDF, минуя любую обработку, которую WordPress применяет к контенту в своем внутреннем редакторе.Это для простоты разработки, поскольку использование редактора WP для очень длинной страницы нецелесообразно.

Когда я использую редактор WP, текст отображается идеально, но с использованием чистого HTML (через шаблон, заменяя * 1003).*) символы со странной кодировкой из PDF, такие как объединенные "fi" и некоторые другие символы, отображаются неправильно, в виде ромбов и вопросительных знаков.

Кодировка UTF-8 в обоих моих редакторах (NetBeans) и страница WordPress.

Может кто-нибудь объяснить, как WordPress «знает», как заменить эти символы и как я могу сделать то же самое в моем исходном коде?Полагаю, использование PHP - вариант.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...