У меня есть несколько файлов MS Word, которые клиент хочет отобразить на своем веб-сайте. Я преобразовал их в HTML с помощью «Сохранить как веб-страницу» - и да, я знаю, что это приводит к паршивому HTML, но другие методы, которые я пытался потерять, ссылаются на встроенные изображения.
По большей части я могу использовать PHP для очистки дисплея, но один элемент меня совершенно сбил с толку: все одинарные и двойные кавычки появляются как различные буквы с диакритическими знаками (акцентами), и я не могу понять, как обнаружить их и преобразовать их в правильные объекты HTML. Например: Õ (O тильда) должна быть в одинарных кавычках, Ò (O могила) должна быть в открытых двойных кавычках, Ó (O острая) должна быть в двойных кавычках. Я попробовал htmlentities, iconv и кучу других методов без удачи.