Ребята, которые написали Winword и его генерацию HTML, умные ребята.Если бы было легко использовать функции HTML в чистом виде, они бы так и сделали.
Word - это создание макетов, оптимизированных для бумаги.он поддерживает такие понятия, как табуляции и многоуровневая нумерация, которые HTML не поддерживает или только начинает.В результате HTML-версия документа Word - это не «красивый» HTML, а попытка точно сохранить возможности документа Word.
Когда Word повторно открывает сохраненный файл HTML, онделает некоторые хитрые реверс-инжиниринг документа, чтобы рендеринг в Word выглядел почти так же, как и началсяТочно так же, если вы вставите HTML-код в виде фрагмента на веб-страницу, сохранив Word CSS, результаты будут довольно точными.В этом случае существует культурный конфликт между базовым CSS веб-страницы и CSS Word, и требуются некоторые усилия, чтобы извлечь выгоду из плохой работы.Word HTML также не использует UTF-8, который требует некоторой обработки.
HTMLTidy может использоваться для удаления разметки Word, но после этого требуется более массивный массаж для хорошей визуализации на веб-странице.Я работал над продуктом в течение 15 лет, который смешивает Word и веб-страницы, и результаты могут быть весьма хорошими, если вы настроите CSS.
Мы использовали Word, потому что мы создаем бумажные версии и импортируем текст из отчетов, написанных в Word, а не потому, что мы не смогли найти специальный редактор HTML.
Я бы не рекомендовал использовать Wordсоздать аккуратный пурист HTML.Вы не использовали бы открывашку, чтобы открыть бутылку вина?
Жизнь была бы намного проще, если бы: a) Microsoft перепроектировала множество опций для своей очень запутанной функции «маркеры и числа», b) HTML предоставила встроенную и правильно функционирующую поддержку многоуровневой нумерации вместоиз запоздалых подходов, доступных в настоящее время.Слабость HTML в этой области можно увидеть в хрупких вариантах нумерации, доступных в Документах Google.
Так много улучшилось с HTML 5, может быть, мы можем надеяться, что HTML 6 поможет преодолеть разрыв между текстовым процессором и редактором HTML.