Я пишу функцию для преобразования текста в стиле MS Word в текст в формате Adobe InDesign (для обозначения стиля используется тип XML). Текст вставляется в текстовый редактор TinyMCE, который затем отправляет код в формате HTML в функцию php.
Я пробовал эту функцию, чтобы очистить код, как только он достигнет моего кода преобразования:
$text = iconv("windows-1250", "UTF-8", $html);
Когда я использую какие-либо «особые» символы, все идет не так. Знаки £, é (или любые другие акценты) и различные «вьющиеся» апострофы / кавычки, кажется, ломают вещи. Например, если я пытаюсь преобразовать знак £
, код возвращает \u0141
, но я получаю символ Ł
, отображаемый на экране, когда функция возвращает.
Кто-нибудь знает, что я могу сделать, чтобы странные символы Word не ломали все, что я делаю?